刷屏的Sora 2，不是“AI抖音”时刻（附邀请码）

641 0 0

文章摘要

OpenAI正式推出新一代视频生成模型Sora 2，并将其以独立iOS应用的形式发布，标志着从技术模型向消费级产品的转型。Sora应用在美国和加拿大率先上线，采用邀请制，用户可生成并分享10秒视频，浏览个性化推荐流，并通过点赞、评论和二次创作与他人互动。与第一代Sora相比，Sora 2不再局限于ChatGPT Plus的附加功能，而是直接进入消费级市场，成为一款带有短视频流和互动机制的App。

Sora 2的最大变化之一是实现了同步音频生成。过去AI视频往往只负责影像，声音需要后期叠加，而现在用户可以在同一次生成里得到语音对白、环境音效和音轨，带来更完整的沉浸式体验。OpenAI在研究博文中强调，Sora 2在物理一致性、动作连贯性和指令跟随上都有明显提升，并配合安全过滤机制，限制错误信息或不当内容的生成。这一功能被认为是与Google Veo 3等竞品正面竞争的关键点。

Cameo功能是Sora 2的另一大亮点。用户可以通过一次性录入确认身份，并上传肖像和声音样本，生成“可授权的虚拟分身”。这一功能允许用户将自身形象插入AI生成的视频场景中，强调“本人同意、本人形象”的设计逻辑，未经授权的第三方形象被禁止使用。OpenAI表示，Cameo功能在内部测试阶段已被频繁使用，能够在任意场景中重现面部、声音与动作一致性。

OpenAI展示了多组由Sora 2生成的视频案例，包括花样滑冰运动员完成高难度动作、山地探险家在雪地中呼喊等场景。这些案例展示了Sora 2在动作、环境和声音上趋近真实世界的能力，而不仅仅是生成影像。此外，Sora App还同步上线了家长控制功能，允许为青少年账号设置非个性化内容流、关闭私信和限制连播，这是OpenAI在内容安全上的重要防护措施。

版权管理方面，OpenAI可能采用“版权所有者选择退出”机制，引发好莱坞关注。迪士尼等大型内容公司已宣布选择退出，以避免其作品被模型用作生成数据。这一做法在业内引发争议，同时也体现了AI生成内容与版权保护的复杂关系。

从Sora 1到Sora 2，OpenAI实现了从工具属性向消费级应用的转变。Sora 1主要服务于ChatGPT用户，强调“文本到视频”的突破，而Sora 2则通过App降低门槛，激发社交属性，让AI视频进入日常内容生态。这种“模型+平台”的组合，使得AI视频不再只是技术炫技，而是成为一种新的表达语言。

尽管Sora 2被广泛称为“AI版抖音”，但其实际意义更接近于当年的musical.ly。musical.ly首次让人们看到短视频是一种全新的表达语言，而Sora 2则让大众直观感受到AI生成的视频可以创造出全新的叙事风格。这种从“拍摄”到“想象”的思路迁移，类似于短视频从“记录”到“表演”的转折。OpenAI通过Sora 2扮演了“教育角色”，让更广泛的人直观地体验AI视频，并产生“原来还能这样讲故事”的感受。

Sora 2开启的商业可能性并非由OpenAI独占，而是为行业提供了新的起点。其意义不在于短期内带来爆炸性流量或商业化，而在于展示了一种新媒介的可能性。随着更多用户参与和内容创新，AI视频有望成为未来社交和创作的重要形式。