易发投资 - 新闻热点

OpenAI 正式发布影片生成模型Sora @ 2024-02-18T16: 返回新闻热点

关键词：影片生成文字模型

概念：文字生成影片模型

说到文字生成影片的ＡＩ模型，ＭＥＴＡ、ＧＯＯＧＬＥ、ＲＵＮＷＡＹ等都其实也有，甚至有提供公众使用，不过ＯＰＥＮＡＩ的ＳＯＲＡ是目前唯一能生成６０秒长的内容，而且是整段影片一口气生成，而非像其他模型般逐格生成再连续播放。

ＯＰＥＮＡＩ名为ＳＯＲＡ的新人工智能模型可以根据文本提示生成细节丰富的影片。该技术在令许多人惊叹的同时也引发了混淆视听的担忧。ＯＰＥＮＡＩ表示，一组研究人员将找出该工具可能被滥用的方式来予以防范。ＯＰＥＮＡＩ旗下的人工智能工具包括ＣＨＡＴＧＰＴ。封面图片来源：ＯＰＥＮＡＩ

ＯＰＥＮＡＩ表示，ＳＯＲＡ目前为未完成的产品，可能难以消化复杂的物理或空间细节，导致生成不合逻辑的影片，例如：人在跑步机上可能跑错方向，或博物馆影片中地板会“移动”及影片中被咬的饼干不会出现被咬过后的缺口等，目前仅对正在评估潜在危害和风险的“红队成员”开放，以帮助识别系统中的缺陷，藉此获得使用回馈。依照ＯＰＥＮＡＩ技术推进及ＡＩ成长速度，一般预料，明年文字生成影片这项功能，就会有机会进入一般消费者可以使用存取的应用阶段。

【明报专讯】ＣＨＡＴＧＰＴ母企ＯＰＥＮＡＩ公布开发了全新的ＡＩ模型ＳＯＲＡ（日文指天空），它可根据文字提示，生成１分钟的高清影片，又或基于静态图像生成影片，并可在原有的影片加入新的影像。该模型暂未对外开放，目前仅供少数研究员及电影制作人使用，以评估该模型被滥用的风险。ＯＰＥＮＡＩ正测试用户能否绕过其服务条款限制，生成违规的极端暴力、色情、仇恨或侵权影像。部分影片制作者忧虑，新模型令影视业者饭碗不保。

从技术层面而言，ＳＯＲＡ是一个扩散模型，能从一个看似静态噪音（ＳＴＡＴＩＣＮＯＩＳＥ）的影格开始，逐步透过去除噪音生成一则影片。ＳＯＲＡ是在ＤＡＬＬ-Ｅ及ＧＰＴ模型的研究基础上发展，它使用ＤＡＬＬ-Ｅ３的重描述（ＲＥＣＡＰＴＩＯＮＩＮＧ）技术，能为视觉训练资料产生高度描述文字，因此能依循用户文字指令产生影片。除了根据文字指示外，该模型也能将静态图片动态化以生成影片。ＳＯＲＡ能从无到有生成全新影片，也能延长现有影片，或是将遗失的影格补上。

ＯＰＥＮＡＩ的ＳＯＲＡ模型可以透过输入文字或者图片自动生成长达６０秒的影片，从示范片段中可见，生成的影片无论在画质、影片中物件的连贯性以及对人体和物理环境的描绘准确度都相当强劲，相对于ＲＵＮＷＡＹ、ＰＩＫＡ和ＳＴＡＢＩＬＩＴＹＡＩ等初创公司的类似模型，以及ＧＯＯＧＬＥ的ＬＵＭＩＥＲＥ模型等都有优势。ＯＰＥＮＡＩ指，ＳＯＲＡ使用的技术是基于过往开发ＤＡＬＬ-Ｅ和ＧＰＴ系列模型的经验，基于ＴＲＡＮＳＦＯＲＭＥＲ架构开发，能够在流畅度和画质上带来极佳表现。

生成式人工智能（ＧＥＮＡＩ）巨头ＯＰＥＮＡＩ去年藉ＣＨＡＴＧＰＴ而为人熟悉，其后也开发出文字、图片各类生成工具。近日ＯＰＥＮＡＩ又有“新搞作”，于昨（１５日）公布影片生成ＡＩ模型“ＳＯＲＡ”。

外媒报道，人工智能(ＡＩ)公司ＯＰＥＮＡＩ正在开发一款可以“文字转影片”的ＡＩ模型“ＳＯＲＡ”，原理和ＯＰＥＮＡＩ的图像生成ＡＩ工具ＤＡＬＬ-Ｅ类似，透过使用者输入的文字提示来生成影片，目前仅能生成最多１分钟的影片。

ＣＨＡＴＧＰＴ开发公司ＯＰＥＮＡＩ日前推出新生成式人工智能（ＡＩ）模型“ＳＯＲＡ”，可根据文字提示及要求生成短影片，虽然目前只提供最长６０秒ＡＩ生成影片，画面细节亦尚有少许瑕疵，但影片质素及多元化依然令各界印象深刻，加上ＳＯＲＡ为当今唯一进入“影片生成”市场的产品，因而引发热烈讨论。分析认为ＳＯＲＡ的面世不但令ＡＩ风潮持续加温，亦造成三大行业即将变天。

ＯＰＥＮＡＩ１５日正式发布影片生成模型ＳＯＲＡ，该模型只要输入简短文字，就能生成约一分钟影片。

ＯＰＥＮＡＩ宣布发布首个视频生成模型ＳＯＲＡ，能够根据文字提示生成影片。

就在今（１６）日凌晨，ＯＰＥＮＡＩ在Ｘ上介绍一款名为ＳＯＲＡ的新模型，其建立在ＤＡＬＬ·Ｅ和ＧＰＴ模型的研究之上，可根据文字提示生成长度一分钟的影片。尽管目前尚未向市场推出，但释出的范例影片已引起社群广泛讨论。

ＯＰＥＮＡＩ在官网上展示了ＳＯＲＡ多个应用范例，并公开了这些影片生成的文字指令，其中一个仿若来自真实东京街头场景，一名身着皮衣、红色长裙女人走在街头的影片，ＯＰＥＮＡＩ在影片下方公开其画面指令，无论是影片里出现的女人脸上出现的墨镜、红色口红，街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节，无一不符合该生成影片文字描述。

创造聊天机械人ＣＨＡＴＧＰＴ的人工智能（ＡＩ）公司ＯＰＥＮＡＩ，今日（１６日）公布推出一款名为“ＳＯＲＡ”的影片生成工具模型，能根据使用者给予的文字指令生成短影片，片长度最多６０秒，也可依据静态图像制作动画。

ＣＨＡＴＧＰＴ开发商ＯＰＥＮＡＩ发布影片生成模型“ＳＯＲＡ”，展示多条基于文字生成的ＡＩ生成影片

人工智能公司ＯＰＥＮＡＩ公布新生成式ＡＩ模型“ＳＯＲＡ”，可利用根据文字提示生成短影片，现时尚未开放公众使用。

[ＮＥＷＴＡＬＫ新闻] 人工智慧新创公司ＯＰＥＮＡＩ宣布正在开发名为ＳＯＲＡ的新模型，可根据文字提示生成短影片。尽管尚未向大众开放使用，但已引起网上回响。根据ＯＰＥＮＡＩ在社群平台上的宣布，ＳＯＲＡ能够根据用户给予的提示生成包含多个角色和特定类型的动态画面的影片。它将根据提示的主题与背景精准生成影片内容，并呈现复杂的摄影机运镜，影片长度最多可达６０秒。此外，ＳＯＲＡ还可以根据静态影像制作动画。ＳＯＲＡ是一个类似于ＭＥＴＡ和ＧＯＯＧＬＥ释出的ＥＭＵＶＩＤＥＯ及ＶＩＤＥＯＰＯＥＴ的人工智模型。然而，ＯＰＥＮＡＩ指出，ＳＯＲＡ目前仍处于未完成阶段，可能难以处理复杂的物理或空间细节，可能导致生成不合逻辑的影片。该公司表示，ＳＯＲＡ目前可用于红队演练，以帮助识别人工智慧系统中的缺陷，同时也可供视觉艺术家、设计师和电影制作人使用。面对产品引起的争议，ＯＰＥＮＡＩ强调正在开发工具用以检测影片是否由ＳＯＲＡ生成。未来，ＯＰＥＮＡＩ也将利用团队现有的安全技术，为ＳＯＲＡ加入安全措施。例如，文字分类器将会拒绝违反使用政策的提示，而图像分类器

生成影片的ＡＩ其实并不新鲜，从ＧＯＯＧＬＥ、ＭＥＴＡ等科技巨头到成立不满一年的新创ＰＩＫＡＬＡＢＳ等公司，都发表过生成影片的ＡＩ技术。而ＳＯＲＡ最大的特点在于极其逼真，外媒《ＷＩＲＥＤ》声称，这是没有在其他影片生成ＡＩ模型中看见过的真实感，并且生成的影片长于其他模型。

ＯＰＥＮＡＩ将推出新ＡＩ模型可透过文字生成短影片

经过测试，ＳＯＲＡ可以生成各种风格（包括真实电影，动漫风或黑白）的影片，长度可达一分钟，远远超过目前大多数其他市面上的文字转影片模型，而且这些影片都尽可能在保持合理的连贯性上，像是他们展示的第一款影片中除了文字之外，街上水洼的倒影、衣服随走路的摆动效果，甚至是主角脸上的肌理都栩栩如生。

（中央社旧金山１５日综合外电报导）创造聊天机器人ＣＨＡＴＧＰＴ和图像生成器ＤＡＬＬ-Ｅ的科技公司ＯＰＥＮＡＩ表示，公司正在测试一款由文本转为影片的模型ＳＯＲＡ，能让用户透过简单的指令创造出逼真的影片。

流动版 | 完全版

论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南

版权所有不得转载 (C) 2025 Suntek Computer Systems Limited.

免责声明 : 88iv设立此一网站，旨在以最快捷的方式为公众人士提供清楚准确的最新资料，但在整理资料及编写程式时或会有无心之失。故88iv特此声明，此一网站所载的资料如有任何不确之处、遗漏或误植错字，并引致任何直接或间接的损失或亏损，88iv概不负责，亦不会作出任何赔偿（不论根据侵权法、合约或其他规定亦然）。此外，88iv并不保证本网站所载的资料乃属正确无误及完整无缺，亦不担保可以及时将资料上网及内容适合有关用途。