易发投资 - 新闻热点

彻底炸了！今天，又一次见证历史！ @ 2024-02-16T20: 返回新闻热点

关键词：影片生成模型文字

概念：生成影片模型

说到文字生成影片的ＡＩ模型，ＭＥＴＡ、ＧＯＯＧＬＥ、ＲＵＮＷＡＹ等都其实也有，甚至有提供公众使用，不过ＯＰＥＮＡＩ的ＳＯＲＡ是目前唯一能生成６０秒长的内容，而且是整段影片一口气生成，而非像其他模型般逐格生成再连续播放。

ＯＰＥＮＡＩ名为ＳＯＲＡ的新人工智能模型可以根据文本提示生成细节丰富的影片。该技术在令许多人惊叹的同时也引发了混淆视听的担忧。ＯＰＥＮＡＩ表示，一组研究人员将找出该工具可能被滥用的方式来予以防范。ＯＰＥＮＡＩ旗下的人工智能工具包括ＣＨＡＴＧＰＴ。封面图片来源：ＯＰＥＮＡＩ

除了能够仅根据文本指令生成影片之外，该模型还能够获取现有的静态图像并从中生成影片，准确地让图像内容动起来并关注小细节。

外媒报道，人工智能(ＡＩ)公司ＯＰＥＮＡＩ正在开发一款可以“文字转影片”的ＡＩ模型“ＳＯＲＡ”，原理和ＯＰＥＮＡＩ的图像生成ＡＩ工具ＤＡＬＬ-Ｅ类似，透过使用者输入的文字提示来生成影片，目前仅能生成最多１分钟的影片。

ＯＰＥＮＡＩ的ＳＯＲＡ模型可以透过输入文字或者图片自动生成长达６０秒的影片，从示范片段中可见，生成的影片无论在画质、影片中物件的连贯性以及对人体和物理环境的描绘准确度都相当强劲，相对于ＲＵＮＷＡＹ、ＰＩＫＡ和ＳＴＡＢＩＬＩＴＹＡＩ等初创公司的类似模型，以及ＧＯＯＧＬＥ的ＬＵＭＩＥＲＥ模型等都有优势。ＯＰＥＮＡＩ指，ＳＯＲＡ使用的技术是基于过往开发ＤＡＬＬ-Ｅ和ＧＰＴ系列模型的经验，基于ＴＲＡＮＳＦＯＲＭＥＲ架构开发，能够在流畅度和画质上带来极佳表现。

ＣＨＡＴＧＰＴ开发商ＯＰＥＮＡＩ发布影片生成模型“ＳＯＲＡ”，展示多条基于文字生成的ＡＩ生成影片

从技术层面而言，ＳＯＲＡ是一个扩散模型，能从一个看似静态噪音（ＳＴＡＴＩＣＮＯＩＳＥ）的影格开始，逐步透过去除噪音生成一则影片。ＳＯＲＡ是在ＤＡＬＬ-Ｅ及ＧＰＴ模型的研究基础上发展，它使用ＤＡＬＬ-Ｅ３的重描述（ＲＥＣＡＰＴＩＯＮＩＮＧ）技术，能为视觉训练资料产生高度描述文字，因此能依循用户文字指令产生影片。除了根据文字指示外，该模型也能将静态图片动态化以生成影片。ＳＯＲＡ能从无到有生成全新影片，也能延长现有影片，或是将遗失的影格补上。

ＯＰＥＮＡＩ在官网上展示了ＳＯＲＡ多个应用范例，并公开了这些影片生成的文字指令，其中一个仿若来自真实东京街头场景，一名身着皮衣、红色长裙女人走在街头的影片，ＯＰＥＮＡＩ在影片下方公开其画面指令，无论是影片里出现的女人脸上出现的墨镜、红色口红，街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节，无一不符合该生成影片文字描述。

就在今（１６）日凌晨，ＯＰＥＮＡＩ在Ｘ上推出一款新生成影片模型“ＳＯＲＡ”，可根据文字提示、或是静态图片生成长度一分钟的短影片。尽管目前尚未向市场推出，但其释出的范例影片品质和细节真实度已轰动社群，甚至有网友表示这足以撼动整个影视产业。

（中央社旧金山１５日综合外电报导）创造聊天机器人ＣＨＡＴＧＰＴ和图像生成器ＤＡＬＬ-Ｅ的科技公司ＯＰＥＮＡＩ表示，公司正在测试一款由文本转为影片的模型ＳＯＲＡ，能让用户透过简单的指令创造出逼真的影片。

人工智能公司ＯＰＥＮＡＩ公布新生成式ＡＩ模型“ＳＯＲＡ”，可利用根据文字提示生成短影片，现时尚未开放公众使用。

[ＮＥＷＴＡＬＫ新闻] ＯＰＥＮＡＩ今(１６)日发布了最新的影片生成ＡＩ模型ＳＯＲＡ(日文“空”罗马拼音)，这是一个能够将文字描述转换为长达６０秒影片的创新技术，并能够呈现出丰富场景细节、多角色互动和多角度运镜的高品质影片。ＯＰＥＮＡＩ在官网上展示了多个应用范例，影片品质皆具极高水准，并同时公开了这些影片的文字指令。ＯＰＥＮＡＩ在官网上展示了ＳＯＲＡ多个应用范例，并公开了这些影片生成的文字指令，其中一个仿若来自真实东京街头场景，一名身着皮衣、红色长裙女人走在街头的影片，ＯＰＥＮＡＩ在影片下方公开其画面指令，无论是影片里出现的女人脸上出现的墨镜、红色口红，街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节，无一不符合该生成影片文字描述。而除了真人，ＳＯＲＡ还可生成动画角色，其范例中即有一个可爱的毛茸茸小怪物跪在融化红蜡烛旁边的影片，ＯＰＥＮＡＩ也公开该影片的生成文字指令，影片中可爱的小怪物睁大眼睛和张开嘴巴看着红蜡烛，传达出的纯真和俏皮感觉，则完全符合其指令需求。ＯＰＥＮＡＩ表示，ＳＯＲＡ不只能够从文字生成影片，也能够从静态图像或现有影片进行延伸和变化。ＯＰＥＮＡ解释，该模型对语

ＯＰＥＮＡＩ官方Ｘ帐号在今（１６）日发布了一则贴文，简单介绍了ＳＯＲＡＡＩ模型功能，该模型可以根据使用者提供的文字提示自动生成影片，影片内容可以包含多名角色，搭配特定的动态场景。不过ＯＰＥＮＡＩ官方也强调说ＳＯＲＡ目前是未完成的产品，可能无法理解复杂的物理或空间细节，导致生成不合逻辑的短影片。

生成式人工智能（ＧＥＮＡＩ）巨头ＯＰＥＮＡＩ去年藉ＣＨＡＴＧＰＴ而为人熟悉，其后也开发出文字、图片各类生成工具。近日ＯＰＥＮＡＩ又有“新搞作”，于昨（１５日）公布影片生成ＡＩ模型“ＳＯＲＡ”。

ＯＰＥＮＡＩ将推出新ＡＩ模型可透过文字生成短影片

ＯＰＥＮＡＩ日前发布了全新影片生成模型ＳＯＲＡ，让用家可以用文字生成影片。据《ＭＡＳＨＡＢＬＥ》报道，ＳＯＲＡ可以生成１分钟的影片，而且这些影片非常逼真，看起来就如真实拍摄般样。网民对ＳＯＲＡ态度两极，部分网民表示有兴趣试玩ＳＯＲＡ，另外有网民则表示担心影片制作行业将会式微。

ＯＰＥＮＡＩ除了有聊天机器人ＣＨＡＴＧＰＴ、ＡＩ文生图工具ＤＡＬＬ-Ｅ３外，现在也要开始在“ＡＩ影片生成”上发力！日前ＯＰＥＮＡＩ宣布推出全新影片生成模型“ＳＯＲＡ”，只要透过文字叙述即可生成一部时长６０秒的超逼真影片。

ＯＰＥＮＡＩ在１５日发表的公告中表示，该公司正在教授人工智慧“理解和模拟运动中的物理世界”，希望训练模型帮助人们解决需要现实世界互动的问题。目前ＯＰＥＮＡＩ推出的解决方案，就是文字转化视讯的人工智慧模型ＳＯＲＡ：目前ＳＯＲＡ已经可以根据用户的文字提示，产生长达一分钟的高品质影片。

经过测试，ＳＯＲＡ可以生成各种风格（包括真实电影，动漫风或黑白）的影片，长度可达一分钟，远远超过目前大多数其他市面上的文字转影片模型，而且这些影片都尽可能在保持合理的连贯性上，像是他们展示的第一款影片中除了文字之外，街上水洼的倒影、衣服随走路的摆动效果，甚至是主角脸上的肌理都栩栩如生。

ＯＰＥＮＡＩ表示，除了将文字转换成影片，ＳＯＲＡ也可以把图片动态化生成影片，或是根据现有影片延长补充。ＯＰＥＮＡＩ相信，ＳＯＲＡ将是实现通用人工智慧（ＡＲＴＩＦＩＣＩＡＬＧＥＮＥＲＡＬＩＮＴＥＬＬＩＧＥＮＣＥ，ＡＧＩ）的重要里程碑，因为它能深度理解使用者的文字以及现实世界，才能进行精准的影片生成演绎。

流动版 | 完全版

论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南

版权所有不得转载 (C) 2025 Suntek Computer Systems Limited.

免责声明 : 88iv设立此一网站，旨在以最快捷的方式为公众人士提供清楚准确的最新资料，但在整理资料及编写程式时或会有无心之失。故88iv特此声明，此一网站所载的资料如有任何不确之处、遗漏或误植错字，并引致任何直接或间接的损失或亏损，88iv概不负责，亦不会作出任何赔偿（不论根据侵权法、合约或其他规定亦然）。此外，88iv并不保证本网站所载的资料乃属正确无误及完整无缺，亦不担保可以及时将资料上网及内容适合有关用途。