seedance2.0，已经不是一个视频模型了（生财）

我从 Seedance 2.0 公测开始就一直在测，测了将近半个月，跑了几十个不同类目的案例，包括食品、服装、美妆、个护……今天我想认真跟你聊聊，这个东西对电商到底意味着什么。

先说结论：Seedance 2.0 不是视频模型的升级，它是一个导演级的创作 agent。

这个区别，比你想象的要大得多。

在 Seedance 2.0 出来之前，我用得最多的是 Sora2。

Sora2 其实已经很厉害了，生成的画面质量是不错的。

但它有一个根本性的问题：它是一个执行工具，不是一个创作伙伴。

什么意思？

用 Sora 的时候，你必须把所有的细节都描述清楚。你的产品是什么颜色的包装，人物是什么发型，这个镜头光线是从左侧打进来还是右侧，这个动作是慢放还是正常速度……你每漏一个细节，它就会在那个地方「自由发挥」，然后生成出一些稀奇古怪的东西来。

而且 Sora 只能上传一张图片作为参考。你想同时维持人物一致性和产品一致性，基本上是不可能的事，如果是更复杂的物理交互和动作模仿，更是想都不用想。

很多同学为了解决这个问题，会用九宫格分镜图——把每一个镜头画出来，告诉 AI 这个分镜应该是什么样。这个方法有用，但太费时间了，而且普通电商团队根本执行不下去。

所以以前用 AI 做视频，本质上是：你需要比 AI 更懂视频，才能让 AI 帮你做视频。

这个逻辑是倒过来的。

Seedance 2.0 改变了什么？

Seedance 2.0 最大的变化，不是说它生成的画面更好看了——虽然确实好看了很多。

最大的变化是它的底层逻辑变了。

它现在是一个导演级的 agent，不再是一个单纯的执行工具。

具体来说有三个方面的变化：

第一，全能参考。

Seedance 2.0 支持最多上传 9 张图片 + 3 段视频，总参考上限是 12 个。

这一个改变，直接把以前最头痛的「产品一致性」问题给解决了。你把产品从各个角度拍几张图，人物图片也给它，统统传进去，它就能很好地保持整条视频里面的一致性，不会出现货不对版的情况。

以前那种生成出来跟实物差十万八千里的问题，现在基本上不存在了。

而且视频也可以作为参考上传，上限是总时长不超过 15 秒。这个能力非常关键，因为有些东西是静态图片无法传达的，比如说产品的物理形态、液体的流动方式、某个特定的镜头语言……这些你都可以直接用视频告诉它。

第二，导演思维。

这个是最让我惊到的地方。

我测试过一条服装带货视频，提示词非常简单，我只告诉它：生成一条芭比裤的带货视频，卖点是高腰收腹、不粘毛。

我没有告诉它要怎么体现「不粘毛」，但它自己想到了用一根毛放在裤子上然后轻轻一擦的镜头。

为了更好的阅读体验，来飞书看吧：

Comments on "seedance2.0，已经不是一个视频模型了（生财）" :