我从 Seedance 2.0 公测开始就一直在测,测了将近半个月,跑了几十个不同类目的案例,包括食品、服装、美妆、个护……今天我想认真跟你聊聊,这个东西对电商到底意味着什么。
先说结论:Seedance 2.0 不是视频模型的升级,它是一个导演级的创作 agent。
这个区别,比你想象的要大得多。
在 Seedance 2.0 出来之前,我用得最多的是 Sora2。
Sora2 其实已经很厉害了,生成的画面质量是不错的。
但它有一个根本性的问题:它是一个执行工具,不是一个创作伙伴。
什么意思?
用 Sora 的时候,你必须把所有的细节都描述清楚。你的产品是什么颜色的包装,人物是什么发型,这个镜头光线是从左侧打进来还是右侧,这个动作是慢放还是正常速度……你每漏一个细节,它就会在那个地方「自由发挥」,然后生成出一些稀奇古怪的东西来。
而且 Sora 只能上传一张图片作为参考。你想同时维持人物一致性和产品一致性,基本上是不可能的事,如果是更复杂的物理交互和动作模仿,更是想都不用想。
很多同学为了解决这个问题,会用九宫格分镜图——把每一个镜头画出来,告诉 AI 这个分镜应该是什么样。这个方法有用,但太费时间了,而且普通电商团队根本执行不下去。
所以以前用 AI 做视频,本质上是:你需要比 AI 更懂视频,才能让 AI 帮你做视频。
这个逻辑是倒过来的。
Seedance 2.0 改变了什么?
Seedance 2.0 最大的变化,不是说它生成的画面更好看了——虽然确实好看了很多。
最大的变化是它的底层逻辑变了。
它现在是一个导演级的 agent,不再是一个单纯的执行工具。
具体来说有三个方面的变化:
第一,全能参考。
Seedance 2.0 支持最多上传 9 张图片 + 3 段视频,总参考上限是 12 个。
这一个改变,直接把以前最头痛的「产品一致性」问题给解决了。你把产品从各个角度拍几张图,人物图片也给它,统统传进去,它就能很好地保持整条视频里面的一致性,不会出现货不对版的情况。
以前那种生成出来跟实物差十万八千里的问题,现在基本上不存在了。
而且视频也可以作为参考上传,上限是总时长不超过 15 秒。这个能力非常关键,因为有些东西是静态图片无法传达的,比如说产品的物理形态、液体的流动方式、某个特定的镜头语言……这些你都可以直接用视频告诉它。
第二,导演思维。
这个是最让我惊到的地方。
我测试过一条服装带货视频,提示词非常简单,我只告诉它:生成一条芭比裤的带货视频,卖点是高腰收腹、不粘毛。
我没有告诉它要怎么体现「不粘毛」,但它自己想到了用一根毛放在裤子上然后轻轻一擦的镜头。
为了更好的阅读体验,来飞书看吧:
https://bvvp9yto7k.feishu.cn/wiki/PWugweH0IiMX6Dk1ylGczF2ingb
Comments on "seedance2.0,已经不是一个视频模型了 (生财)" :