OpenAI 新王炸视频生成模型Sora将带来什么影响?

在二月底,Sora的亮相为Open AI在人工智能领域再添辉煌。从已公布的演示视频中,我们可以目睹Sora所展现的非凡实力——生成包含多重角色进行特定互动的复杂场景。

OpenAI在其技术报告中,对Sora这类视频生成模型给予了极高的评价:“它如同世界的模拟器,是我们理解并模拟现实世界的基础。我们坚信,这种能力将在实现通用人工智能(AGI)的道路上成为重要的里程碑。”

OpenAI 新王炸视频生成模型Sora将带来什么影响?

深入挖掘Open AI官网发布的Sora技术报告,我们可以总结出以下关键信息:

首先,无论是在视频的保真度、长度、稳定性、一致性、分辨率,还是对文字的理解等方面,Sora都展现出了卓越的性能,达到了目前的最优水平。

其次,虽然技术细节并未深入揭示(可能是为了防止模仿),但我们可以大致了解到,Sora采用了视觉块编码的方式,将各种格式的视频统一转化为transformer架构可以训练的嵌入(embedding)。在降维和升维的过程中,Sora引入了一种类似diffusion的unet方法,进行加噪和去噪处理。同时,为了确保模型的强大功能,Sora的模型规模被设计得足够大,从而展现出涌现能力。

再次,相较于其他公司采用基于“小”模型的视频生成策略(如基于前一帧预测后一帧,并用文字或笔刷遮罩进行约束),OpenAI则采用了“大”模型的思路。他们准备了大量的视频数据,利用多模态模型进行标注,将不同格式的视频转化为统一的视觉块嵌入。然后,利用庞大的网络架构、大训练批次(batch size)和强大的算力,使模型能够对大量的训练数据进行全局拟合(理解)。这种方法不仅提高了模型的细节还原能力,还使模型展现出智能涌现能力,如在一定程度上理解真实世界的物理影响和因果关系。

最后,Sora的视频生成模型仅仅是OpenAI世界模型(一种能够理解和模拟真实世界复杂因果关系的通用模型)发展道路上的一个里程碑,而非终点。这无疑给我们带来了无尽的期待和好奇,让我们期待OpenAI未来会带给我们更多的惊喜和突破。

那么Sora所以对我们普通人将会产生什么影响?

对于公司(B端用户)而言:

Sora对所有从事AI视频生成的公司都将面临一次重大的挑战,但同时也是一个机遇。Sora的成功证明了使用大模型进行视频生成的可行性,这意味着这些公司需要思考如何应用大模型来优化自己的视频生成技术。就像ChatGPT的火爆催生了更多大语言模型公司一样,这次挑战也将为AI视频生成领域带来新的机遇。

虽然Sora的具体算力需求尚未公布,但可以预见的是,其所需的算力将不会小。这将为显卡公司带来新的商机。然而,这并不意味着所有显卡公司都将受益。随着算力越来越成为基础设施的一部分,各个国家都将寻求算力的自主可控。这意味着,不仅仅是英伟达,更多的企业和国家都可能加入到算力领域的竞争中来。

对于从事AI三维生成的公司来说,Sora的出现可能会带来第二波冲击。由于多目重建技术的存在,视频生成和3D生成的界限变得模糊。这迫使3D生成公司重新考虑其技术路线和商业叙事逻辑的合理性。

OpenAI 新王炸视频生成模型Sora将带来什么影响?

对于普通人(C端用户)而言:

对于AR以及游戏产业,Sora的出现无疑为其注入了新的活力。内容匮乏的问题将得到缓解,用户体验大幅度提升,AI有助于高逼真场景搭建,更推动XR产业的进一步发展。

视频形态可能会因Sora的出现而发生变革。从单纯的根据用户喜好推荐视频,转变为根据用户喜好针对性生成视频。这意味着,同一部短视频对于不同用户,可能会有不同的(实时)微调版本,从而提供更加个性化的内容。

对创作者来说创作的门槛逐渐减低,人人都可以创作。随着文案、音效和视频AI生成工具的日益完善,一个人独立完成一部短片已成为可能。这将使得优秀的创意和故事更具价值,同时,也意味着才华横溢的创作者将更难以被埋没。但另一方面,创作门槛的降低也意味着故事创作的竞争将变得更为激烈。

综上所述,Open AI Sora视频生成模型技术的出现不仅为商业公司带来了挑战与机遇,也为独立创作者和AR、游戏等产业带来了新的发展契机。同时,它也预示着视频生成和观看方式的巨大变革,将为我们带来更加丰富的视觉体验。

本文资料来源于互联网,仅做网络分享,如有侵权,请联系删除;不代表Sora中文网立场,如若转载,请注明出处:https://www.allinsora.com/4838

(0)
上一篇 2024年3月4日 下午1:23
下一篇 2024年3月4日 下午2:30

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

关注微信
Sora改变AI认知方式,开启走向「世界模拟器」的史诗级的漫漫征途。