— 连续五天的更新之后,我们终于看清了可灵的“真身”。
过去一周,我的首页被可灵刷屏。不是一条爆款,而是五天连环炸。
O1 上线、2.6 音画同出、数字人 2.0 全量开放……
每一天打开手机,都更新了新东西。你可能也刷到过那些标题:“一句话改视频”、“视频版 Nano Banana Pro”、“全流程语义控制”…
但如果你没有真正上手过,你大概率不知道 ——可灵这波更新,已经悄悄把视频创作换了操作系统。
今天这篇文章,我希望你读完会有一种感觉:啊,原来我真的能只用自然语言,把视频做好。
一、O1:它不是更强的视频模型,而是新的创作逻辑
可灵官方给 O1 的定义是 “统一多模态视频模型”。听起来有点像科研论文的标题。但如果用创作者能理解的话来说,它更像:把 “P 图的快感”,搬进了视频里。
你丢一张图,它懂。你丢一个视频,它也懂。你丢七八张角色照片,它开始给你构建“这个人”。
你一句话说想删路人、换季节、加道具,它都能做到。
更关键的是所有这些,不再是不同工具、不同模型,各干各的,而是放在同一个大脑里理解 —— 这就是 “统一模型” 的真正意义。
我第一次意识到 O1 的恐怖,是在把一段街景视频丢进去的时候。
我只是随口说了一句:“把画面里两边的路人删掉,只留下主角一个人”。

为了更好的阅读体验,来飞书看吧:
Comments on "10分钟精通可灵 O1 和 可灵 2.6模型" :