1、介绍
1.1 Sora2 模型升级点
2024 年 12 月,OpenAI 的 Sora1,瞬间引爆了大众对AI视频生成能力的想象。现在 Sora 2 终于来了,而且更加震撼。
Sora 2不仅仅是Sora 1的简单升级,它是一个在理解和模拟现实世界方面更智能、更强大,并且也更容易被创作者控制的新一代模型。而且可以说是当前最顶级的、旗舰级的视频和音频生成系统。是的,它可以原生支持音频和视频的同步生成。
这次发布 Sora2 模型,相较于前代产品在两个核心能力上有了巨大飞跃:
1)更强的物理真实感
它在模拟物体、人物与环境之间如何进行物理互动方面,比以往任何视频模型都更加智能和真实。
比如过去很多模型都无法处理的问题,奥运会体操和滑水后空翻,这些动作涉及到复杂的身体力学、碰撞和动态平衡,对模型的物理理解能力要求极高。
现在 Sora2模型能非常稳健的处理这类复杂的碰撞和动态,让生成的结果看起来极其的自然。
也就是说你用 Sora2 模型生成的视频,里面的动作和物理效果会更符合现实世界的规律,大大减少了过去AI视频中常见的物理错误或怪异感。
2)更好的可操控性
现在很多的模型通常只能一镜到底,很难在一次生成中创作出包含多个镜头、叙事连贯的长故事。
Sora 2在这方面的改进是,它能够更好地在一次生成中讲述更长、更连贯的故事。用户引导和控制模型生成内容的能力相较于以前大大提升了。对于那些想要创作完整短片或复杂叙事的专业人士和普通用户来说,都是一个非常好的消息。
1.2 下载使用
1)APP
使用美区苹果 app store 搜索「Sora by OpenAI」去下载

2)网页
使用美区 IP 访问
https://sora.chatgpt.com/
3)API
官方将在未来几周内推出API,开发者可以通过API将Sora 2的视频生成能力集成到自己的视频编辑软件或其他应用中,从而满足更多样化、更精细的创作需求
2、Sora 2 模型三项革命性新功能
2.1 从单镜头到完整故事
现在很多视频生成模型的一个核心局限就是,它们通常只能逐个镜头地生成内容。
如果你想制作一个包含多个不同镜头的短片(比如一个远景、一个近景、再一个特写),你需要多次生成,然后自己手动拼接,这非常繁琐且难以保证风格和人物的一致性
Sora 2 有了强大的叙事能力,可以在一次生成请求中,就创作出更长、更连贯、包含多个镜头切换的完整故事。这样创作者就可以专注于故事本身,不用再被技术工具所限制了。
2.2 音视频同步输出
这是Sora 2的另一个重大功能:它是第一个能够同时生成视频和音频的Sora模型。
我们现在很多模型只能生成无声的视频片段,用户需要自己后期配音、配乐。而 Sora 2 原生就支持同时生成视频和音频。
而且这个音频生成系统非常强大和通用。它不仅能生成简单的背景音乐或音效,还能:
生成多语种、多角色的对话
生成环境音,比如风声、雨声、城市噪音等,让视频更具沉浸感
2.3 重磅的功能:Cameo (客串)
为了更好的阅读体验,来飞书看吧:
https://pk0zg2jkji.feishu.cn/docx/BPb3dPdNcoN1D7xvGndcU0IGnXc
Comments on "Sora 2正式发布,它不只是个视频模型,更是一个社交宇宙,一篇文章带你了解" :