分享此页

新闻热点

OpenAI推Sora 文字可生成影片- 20240217 - 经济 @ 2024-02-18T08: 返回 新闻热点
关键词:影片 生成 文字 模型
概念:文字生成影片模型
说到文字生成影片的 AI 模型,META、GOOGLE、RUNWAY 等都其实也有,甚至有提供公众使用,不过 OPEN AI 的 SORA 是目前唯一能生成 60 秒长的内容,而且是整段影片一口气生成,而非像其他模型般逐格生成再连续播放。
OPENAI名为SORA的新人工智能模型可以根据文本提示生成细节丰富的影片。该技术在令许多人惊叹的同时也引发了混淆视听的担忧。OPENAI表示,一组研究人员将找出该工具可能被滥用的方式来予以防范。OPENAI旗下的人工智能工具包括CHATGPT。封面图片来源:OPENAI
OPENAI表示,SORA目前为未完成的产品,可能难以消化复杂的物理或空间细节,导致生成不合逻辑的影片,例如:人在跑步机上可能跑错方向,或博物馆影片中地板会“移动”及影片中被咬的饼干不会出现被咬过后的缺口等,目前仅对正在评估潜在危害和风险的“红队成员”开放,以帮助识别系统中的缺陷,藉此获得使用回馈。依照OPEN AI技术推进及AI成长速度,一般预料,明年文字生成影片这项功能,就会有机会进入一般消费者可以使用存取的应用阶段。
【明报专讯】CHATGPT母企OPENAI公布开发了全新的AI模型SORA(日文指天空),它可根据文字提示,生成1分钟的高清影片,又或基于静态图像生成影片,并可在原有的影片加入新的影像。该模型暂未对外开放,目前仅供少数研究员及电影制作人使用,以评估该模型被滥用的风险。OPENAI正测试用户能否绕过其服务条款限制,生成违规的极端暴力、色情、仇恨或侵权影像。部分影片制作者忧虑,新模型令影视业者饭碗不保。
从技术层面而言,SORA是一个扩散模型,能从一个看似静态噪音(STATIC NOISE)的影格开始,逐步透过去除噪音生成一则影片。SORA是在DALL-E及GPT模型的研究基础上发展,它使用DALL-E 3的重描述(RECAPTIONING)技术,能为视觉训练资料产生高度描述文字,因此能依循用户文字指令产生影片。除了根据文字指示外,该模型也能将静态图片动态化以生成影片。SORA能从无到有生成全新影片,也能延长现有影片,或是将遗失的影格补上。
OPENAI 的 SORA 模型可以透过输入文字或者图片自动生成长达 60 秒的影片,从示范片段中可见,生成的影片无论在画质、影片中物件的连贯性以及对人体和物理环境的描绘准确度都相当强劲,相对于 RUNWAY、PIKA 和 STABILITY AI 等初创公司的类似模型,以及 GOOGLE 的 LUMIERE 模型等都有优势。OPENAI 指,SORA 使用的技术是基于过往开发 DALL-E 和 GPT 系列模型的经验,基于 TRANSFORMER 架构开发,能够在流畅度和画质上带来极佳表现。
生成式人工智能(GENAI)巨头OPENAI去年藉CHATGPT而为人熟悉,其后也开发出文字、图片各类生成工具。近日OPENAI又有“新搞作”,于昨(15日)公布影片生成AI模型“SORA”。
外媒报道,人工智能(AI)公司OPENAI正在开发一款可以“文字转影片”的AI模型“SORA”,原理和OPENAI的图像生成AI工具DALL-E类似,透过使用者输入的文字提示来生成影片,目前仅能生成最多1分钟的影片。
就在今(16)日凌晨,OPENAI 在 X 上介绍一款名为 SORA 的新模型,其建立在 DALL·E 和 GPT 模型的研究之上,可根据文字提示生成长度一分钟的影片。尽管目前尚未向市场推出,但释出的范例影片已引起社群广泛讨论。
OPENAI在官网上展示了SORA多个应用范例,并公开了这些影片生成的文字指令,其中一个仿若来自真实东京街头场景,一名身着皮衣、红色长裙女人走在街头的影片,OPENAI在影片下方公开其画面指令,无论是影片里出现的女人脸上出现的墨镜、红色口红,街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节,无一不符合该生成影片文字描述。
创造聊天机械人CHATGPT的人工智能(AI)公司OPENAI,今日(16日)公布推出一款名为“SORA”的影片生成工具模型,能根据使用者给予的文字指令生成短影片,片长度最多60秒,也可依据静态图像制作动画。
CHATGPT开发商OPENAI发布影片生成模型“SORA”,展示多条基于文字生成的AI生成影片
生成影片的AI其实并不新鲜,从GOOGLE、META等科技巨头到成立不满一年的新创PIKA LABS等公司,都发表过生成影片的AI技术。而SORA最大的特点在于极其逼真,外媒《WIRED》声称,这是没有在其他影片生成AI模型中看见过的真实感,并且生成的影片长于其他模型。
人工智能公司OPENAI公布新生成式AI模型“SORA”,可利用根据文字提示生成短影片,现时尚未开放公众使用。
OPENAI 官方 X 帐号在今(16)日发布了一则贴文,简单介绍了 SORA AI 模型功能,该模型可以根据使用者提供的文字提示自动生成影片,影片内容可以包含多名角色,搭配特定的动态场景。不过 OPENAI 官方 也强调说 SORA 目前是未完成的产品,可能无法理解复杂的物理或空间细节,导致生成不合逻辑的短影片。
经过测试,SORA 可以生成各种风格(包括真实电影,动漫风或黑白)的影片,长度可达一分钟,远远超过目前大多数其他市面上的文字转影片模型,而且这些影片都尽可能在保持合理的连贯性上,像是他们展示的第一款影片中除了文字之外,街上水洼的倒影、衣服随走路的摆动效果,甚至是主角脸上的肌理都栩栩如生。
OPENAI将推出新AI模型 可透过文字生成短影片
(中央社旧金山15日综合外电报导)创造聊天机器人CHATGPT和图像生成器DALL-E的科技公司OPENAI表示,公司正在测试一款由文本转为影片的模型SORA,能让用户透过简单的指令创造出逼真的影片。
OPENAI在15日发表的公告中表示,该公司正在教授人工智慧“理解和模拟运动中的物理世界”,希望训练模型帮助人们解决需要现实世界互动的问题。目前OPENAI推出的解决方案,就是文字转化视讯的人工智慧模型SORA:目前SORA已经可以根据用户的文字提示,产生长达一分钟的高品质影片。

流动版 | 完全版
论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南
版权所有 不得转载 (C) 2025 Suntek Computer Systems Limited.
免责声明 : 88iv设立此一网站,旨在以最快捷的方式为公众人士提供清楚准确的最新资料,但在整理资料及编写程式时或会有无心之失。故88iv特此声明,此一网站所载的资料如有任何不确之处、遗漏或误植错字,并引致任何直接或间接的损失或亏损,88iv概不负责,亦不会作出任何赔偿(不论根据侵权法、合约或其他规定亦然)。此外,88iv并不保证本网站所载的资料乃属正确无误及完整无缺,亦不担保可以及时将资料上网及内容适合有关用途。