易发投资 - 新闻热点

OpenAI推Sora 文字可生成影片- 20240217 - 经济 @ 2024-02-18T08: 返回新闻热点

关键词：影片生成文字模型

概念：文字生成影片模型

说到文字生成影片的ＡＩ模型，ＭＥＴＡ、ＧＯＯＧＬＥ、ＲＵＮＷＡＹ等都其实也有，甚至有提供公众使用，不过ＯＰＥＮＡＩ的ＳＯＲＡ是目前唯一能生成６０秒长的内容，而且是整段影片一口气生成，而非像其他模型般逐格生成再连续播放。

ＯＰＥＮＡＩ名为ＳＯＲＡ的新人工智能模型可以根据文本提示生成细节丰富的影片。该技术在令许多人惊叹的同时也引发了混淆视听的担忧。ＯＰＥＮＡＩ表示，一组研究人员将找出该工具可能被滥用的方式来予以防范。ＯＰＥＮＡＩ旗下的人工智能工具包括ＣＨＡＴＧＰＴ。封面图片来源：ＯＰＥＮＡＩ

ＯＰＥＮＡＩ表示，ＳＯＲＡ目前为未完成的产品，可能难以消化复杂的物理或空间细节，导致生成不合逻辑的影片，例如：人在跑步机上可能跑错方向，或博物馆影片中地板会“移动”及影片中被咬的饼干不会出现被咬过后的缺口等，目前仅对正在评估潜在危害和风险的“红队成员”开放，以帮助识别系统中的缺陷，藉此获得使用回馈。依照ＯＰＥＮＡＩ技术推进及ＡＩ成长速度，一般预料，明年文字生成影片这项功能，就会有机会进入一般消费者可以使用存取的应用阶段。

【明报专讯】ＣＨＡＴＧＰＴ母企ＯＰＥＮＡＩ公布开发了全新的ＡＩ模型ＳＯＲＡ（日文指天空），它可根据文字提示，生成１分钟的高清影片，又或基于静态图像生成影片，并可在原有的影片加入新的影像。该模型暂未对外开放，目前仅供少数研究员及电影制作人使用，以评估该模型被滥用的风险。ＯＰＥＮＡＩ正测试用户能否绕过其服务条款限制，生成违规的极端暴力、色情、仇恨或侵权影像。部分影片制作者忧虑，新模型令影视业者饭碗不保。

从技术层面而言，ＳＯＲＡ是一个扩散模型，能从一个看似静态噪音（ＳＴＡＴＩＣＮＯＩＳＥ）的影格开始，逐步透过去除噪音生成一则影片。ＳＯＲＡ是在ＤＡＬＬ-Ｅ及ＧＰＴ模型的研究基础上发展，它使用ＤＡＬＬ-Ｅ３的重描述（ＲＥＣＡＰＴＩＯＮＩＮＧ）技术，能为视觉训练资料产生高度描述文字，因此能依循用户文字指令产生影片。除了根据文字指示外，该模型也能将静态图片动态化以生成影片。ＳＯＲＡ能从无到有生成全新影片，也能延长现有影片，或是将遗失的影格补上。

ＯＰＥＮＡＩ的ＳＯＲＡ模型可以透过输入文字或者图片自动生成长达６０秒的影片，从示范片段中可见，生成的影片无论在画质、影片中物件的连贯性以及对人体和物理环境的描绘准确度都相当强劲，相对于ＲＵＮＷＡＹ、ＰＩＫＡ和ＳＴＡＢＩＬＩＴＹＡＩ等初创公司的类似模型，以及ＧＯＯＧＬＥ的ＬＵＭＩＥＲＥ模型等都有优势。ＯＰＥＮＡＩ指，ＳＯＲＡ使用的技术是基于过往开发ＤＡＬＬ-Ｅ和ＧＰＴ系列模型的经验，基于ＴＲＡＮＳＦＯＲＭＥＲ架构开发，能够在流畅度和画质上带来极佳表现。

生成式人工智能（ＧＥＮＡＩ）巨头ＯＰＥＮＡＩ去年藉ＣＨＡＴＧＰＴ而为人熟悉，其后也开发出文字、图片各类生成工具。近日ＯＰＥＮＡＩ又有“新搞作”，于昨（１５日）公布影片生成ＡＩ模型“ＳＯＲＡ”。

外媒报道，人工智能(ＡＩ)公司ＯＰＥＮＡＩ正在开发一款可以“文字转影片”的ＡＩ模型“ＳＯＲＡ”，原理和ＯＰＥＮＡＩ的图像生成ＡＩ工具ＤＡＬＬ-Ｅ类似，透过使用者输入的文字提示来生成影片，目前仅能生成最多１分钟的影片。

就在今（１６）日凌晨，ＯＰＥＮＡＩ在Ｘ上介绍一款名为ＳＯＲＡ的新模型，其建立在ＤＡＬＬ·Ｅ和ＧＰＴ模型的研究之上，可根据文字提示生成长度一分钟的影片。尽管目前尚未向市场推出，但释出的范例影片已引起社群广泛讨论。

ＯＰＥＮＡＩ在官网上展示了ＳＯＲＡ多个应用范例，并公开了这些影片生成的文字指令，其中一个仿若来自真实东京街头场景，一名身着皮衣、红色长裙女人走在街头的影片，ＯＰＥＮＡＩ在影片下方公开其画面指令，无论是影片里出现的女人脸上出现的墨镜、红色口红，街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节，无一不符合该生成影片文字描述。

创造聊天机械人ＣＨＡＴＧＰＴ的人工智能（ＡＩ）公司ＯＰＥＮＡＩ，今日（１６日）公布推出一款名为“ＳＯＲＡ”的影片生成工具模型，能根据使用者给予的文字指令生成短影片，片长度最多６０秒，也可依据静态图像制作动画。

ＣＨＡＴＧＰＴ开发商ＯＰＥＮＡＩ发布影片生成模型“ＳＯＲＡ”，展示多条基于文字生成的ＡＩ生成影片

生成影片的ＡＩ其实并不新鲜，从ＧＯＯＧＬＥ、ＭＥＴＡ等科技巨头到成立不满一年的新创ＰＩＫＡＬＡＢＳ等公司，都发表过生成影片的ＡＩ技术。而ＳＯＲＡ最大的特点在于极其逼真，外媒《ＷＩＲＥＤ》声称，这是没有在其他影片生成ＡＩ模型中看见过的真实感，并且生成的影片长于其他模型。

人工智能公司ＯＰＥＮＡＩ公布新生成式ＡＩ模型“ＳＯＲＡ”，可利用根据文字提示生成短影片，现时尚未开放公众使用。

ＯＰＥＮＡＩ官方Ｘ帐号在今（１６）日发布了一则贴文，简单介绍了ＳＯＲＡＡＩ模型功能，该模型可以根据使用者提供的文字提示自动生成影片，影片内容可以包含多名角色，搭配特定的动态场景。不过ＯＰＥＮＡＩ官方也强调说ＳＯＲＡ目前是未完成的产品，可能无法理解复杂的物理或空间细节，导致生成不合逻辑的短影片。

经过测试，ＳＯＲＡ可以生成各种风格（包括真实电影，动漫风或黑白）的影片，长度可达一分钟，远远超过目前大多数其他市面上的文字转影片模型，而且这些影片都尽可能在保持合理的连贯性上，像是他们展示的第一款影片中除了文字之外，街上水洼的倒影、衣服随走路的摆动效果，甚至是主角脸上的肌理都栩栩如生。

ＯＰＥＮＡＩ将推出新ＡＩ模型可透过文字生成短影片

（中央社旧金山１５日综合外电报导）创造聊天机器人ＣＨＡＴＧＰＴ和图像生成器ＤＡＬＬ-Ｅ的科技公司ＯＰＥＮＡＩ表示，公司正在测试一款由文本转为影片的模型ＳＯＲＡ，能让用户透过简单的指令创造出逼真的影片。

ＯＰＥＮＡＩ在１５日发表的公告中表示，该公司正在教授人工智慧“理解和模拟运动中的物理世界”，希望训练模型帮助人们解决需要现实世界互动的问题。目前ＯＰＥＮＡＩ推出的解决方案，就是文字转化视讯的人工智慧模型ＳＯＲＡ：目前ＳＯＲＡ已经可以根据用户的文字提示，产生长达一分钟的高品质影片。

流动版 | 完全版

论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南

版权所有不得转载 (C) 2025 Suntek Computer Systems Limited.

免责声明 : 88iv设立此一网站，旨在以最快捷的方式为公众人士提供清楚准确的最新资料，但在整理资料及编写程式时或会有无心之失。故88iv特此声明，此一网站所载的资料如有任何不确之处、遗漏或误植错字，并引致任何直接或间接的损失或亏损，88iv概不负责，亦不会作出任何赔偿（不论根据侵权法、合约或其他规定亦然）。此外，88iv并不保证本网站所载的资料乃属正确无误及完整无缺，亦不担保可以及时将资料上网及内容适合有关用途。