Sora 2正式发布，它不只是个视频模型，更是一个社交宇宙，一篇文章带你了解

1、介绍

1.1 Sora2 模型升级点

2024 年 12 月，OpenAI 的 Sora1，瞬间引爆了大众对AI视频生成能力的想象。现在 Sora 2 终于来了，而且更加震撼。

Sora 2不仅仅是Sora 1的简单升级，它是一个在理解和模拟现实世界方面更智能、更强大，并且也更容易被创作者控制的新一代模型。而且可以说是当前最顶级的、旗舰级的视频和音频生成系统。是的，它可以原生支持音频和视频的同步生成。

这次发布 Sora2 模型，相较于前代产品在两个核心能力上有了巨大飞跃：

1）更强的物理真实感

它在模拟物体、人物与环境之间如何进行物理互动方面，比以往任何视频模型都更加智能和真实。

比如过去很多模型都无法处理的问题，奥运会体操和滑水后空翻，这些动作涉及到复杂的身体力学、碰撞和动态平衡，对模型的物理理解能力要求极高。

现在 Sora2模型能非常稳健的处理这类复杂的碰撞和动态，让生成的结果看起来极其的自然。

也就是说你用 Sora2 模型生成的视频，里面的动作和物理效果会更符合现实世界的规律，大大减少了过去AI视频中常见的物理错误或怪异感。

2）更好的可操控性

现在很多的模型通常只能一镜到底，很难在一次生成中创作出包含多个镜头、叙事连贯的长故事。

Sora 2在这方面的改进是，它能够更好地在一次生成中讲述更长、更连贯的故事。用户引导和控制模型生成内容的能力相较于以前大大提升了。对于那些想要创作完整短片或复杂叙事的专业人士和普通用户来说，都是一个非常好的消息。

1.2 下载使用

1）APP

使用美区苹果 app store 搜索「Sora by OpenAI」去下载

2）网页

使用美区 IP 访问

https://sora.chatgpt.com/

3）API

官方将在未来几周内推出API，开发者可以通过API将Sora 2的视频生成能力集成到自己的视频编辑软件或其他应用中，从而满足更多样化、更精细的创作需求

2、Sora 2 模型三项革命性新功能

2.1 从单镜头到完整故事

现在很多视频生成模型的一个核心局限就是，它们通常只能逐个镜头地生成内容。

如果你想制作一个包含多个不同镜头的短片（比如一个远景、一个近景、再一个特写），你需要多次生成，然后自己手动拼接，这非常繁琐且难以保证风格和人物的一致性

Sora 2 有了强大的叙事能力，可以在一次生成请求中，就创作出更长、更连贯、包含多个镜头切换的完整故事。这样创作者就可以专注于故事本身，不用再被技术工具所限制了。

2.2 音视频同步输出

这是Sora 2的另一个重大功能：它是第一个能够同时生成视频和音频的Sora模型。

我们现在很多模型只能生成无声的视频片段，用户需要自己后期配音、配乐。而 Sora 2 原生就支持同时生成视频和音频。

而且这个音频生成系统非常强大和通用。它不仅能生成简单的背景音乐或音效，还能：

生成多语种、多角色的对话

生成环境音，比如风声、雨声、城市噪音等，让视频更具沉浸感

2.3 重磅的功能：Cameo (客串)

为了更好的阅读体验，来飞书看吧：

Comments on "Sora 2正式发布，它不只是个视频模型，更是一个社交宇宙，一篇文章带你了解" :