最近很多人私下问我一个问题:你们那些 AI 漫剧,镜头这么多,打斗这么复杂,到底是怎么一步一步做出来的?
我一般不会一句话回答。
因为如果只说用什么工具,基本等于没说。
真正决定一部 AI 漫剧能不能跑通的,不是模型版本,也不是抽卡运气,而是你有没有一套能反复执行的制作逻辑。
这篇文章,我不讲宏观方法论,就顺着我们最近一部作品的真实 SOP,拆给你看:一部 AI 漫剧,是怎么从镜头衔接,到剧本,再到分镜、出图、出视频,一步步落地的。
镜头一多就乱?先把声音这条线抓住
很多人第一次做 AI 漫剧,都会在同一个地方翻车:单看每个镜头都挺帅,一剪在一起就碎。
问题往往不在画面,而在听觉断裂。
我们在项目里用得最多的,是两种镜头组接思路。
第一种叫声音内容相似。
你在切镜头的时候,不是硬切画面,而是让声音先“变形”。
观众的大脑,会顺着声音,把两个原本不相关的画面强行连起来。
比如这种用法:海浪拍岸的轰鸣声 ——> 逐渐过渡成 ——> 一个老者沉重的鼾声。这里你只要把音色和节奏对齐,画面怎么跳都成立。
观众感受到的不是转场,是一种情绪的滑行。
再比如:心脏监护仪的滴滴声 节奏对齐后 变成打字机的敲击声。生命和写作,被声音硬生生绑在了一起。
第二种更常用,也更稳,叫声音持续。
简单说就是:上一个镜头的声音,不跟着画面一起切。
人物的对白、环境音、音乐,可以提前进,也可以延后走。
比如J-Cut(声音先入):镜头 A 里人物说 “我找到了一个地方”;画面切到镜头 B 是一整片风景,人物声音在风景里才结束。观众会下意识觉得,这两个镜头本来就该连在一起。
再比如反差用法:热闹派对的音乐 切到 一个人独自走在街头,音乐慢慢变小情绪一下就落下来了(L-Cut 声音后延)。
我们现在做 AIGC 项目,会在分镜阶段就提前规划哪些声音要延续,而不是等剪辑时救命。这一步做对,后面会省非常多事。
从 0 到 1,第一步永远是剧本,而不是工具
真正开始做短片之前,我们一定先把剧本打磨到一个“能扛住镜头”的状态。
如果是已有剧本,我们会做一件事:压节奏,抬钩子。
每一集都必须解决一个明确冲突,同时在结尾留下一个新的问题。
第一集一定要把世界观和主角的核心欲望讲清楚,不然观众不会给你第二次机会。
如果是自己写剧本,逻辑更简单:直接上核心冲突,不铺垫。
三幕式结构一定要清晰,第二幕末尾要有一个足够狠的反转,第三幕给闭合,同时留钩子。
我们还会固定做一件事:拆市面上的爆款短剧和漫剧。

为了更好的阅读体验,来飞书看吧:
Comments on "AI 漫剧真正的分水岭,在视听语言" :