分享此页

新闻热点

彻底炸了!今天,又一次见证历史! @ 2024-02-16T20: 返回 新闻热点
关键词:影片 生成 模型 文字
概念:生成影片模型
说到文字生成影片的 AI 模型,META、GOOGLE、RUNWAY 等都其实也有,甚至有提供公众使用,不过 OPEN AI 的 SORA 是目前唯一能生成 60 秒长的内容,而且是整段影片一口气生成,而非像其他模型般逐格生成再连续播放。
OPENAI名为SORA的新人工智能模型可以根据文本提示生成细节丰富的影片。该技术在令许多人惊叹的同时也引发了混淆视听的担忧。OPENAI表示,一组研究人员将找出该工具可能被滥用的方式来予以防范。OPENAI旗下的人工智能工具包括CHATGPT。封面图片来源:OPENAI
除了能够仅根据文本指令生成影片之外,该模型还能够获取现有的静态图像并从中生成影片,准确地让图像内容动起来并关注小细节。
外媒报道,人工智能(AI)公司OPENAI正在开发一款可以“文字转影片”的AI模型“SORA”,原理和OPENAI的图像生成AI工具DALL-E类似,透过使用者输入的文字提示来生成影片,目前仅能生成最多1分钟的影片。
OPENAI 的 SORA 模型可以透过输入文字或者图片自动生成长达 60 秒的影片,从示范片段中可见,生成的影片无论在画质、影片中物件的连贯性以及对人体和物理环境的描绘准确度都相当强劲,相对于 RUNWAY、PIKA 和 STABILITY AI 等初创公司的类似模型,以及 GOOGLE 的 LUMIERE 模型等都有优势。OPENAI 指,SORA 使用的技术是基于过往开发 DALL-E 和 GPT 系列模型的经验,基于 TRANSFORMER 架构开发,能够在流畅度和画质上带来极佳表现。
CHATGPT开发商OPENAI发布影片生成模型“SORA”,展示多条基于文字生成的AI生成影片
从技术层面而言,SORA是一个扩散模型,能从一个看似静态噪音(STATIC NOISE)的影格开始,逐步透过去除噪音生成一则影片。SORA是在DALL-E及GPT模型的研究基础上发展,它使用DALL-E 3的重描述(RECAPTIONING)技术,能为视觉训练资料产生高度描述文字,因此能依循用户文字指令产生影片。除了根据文字指示外,该模型也能将静态图片动态化以生成影片。SORA能从无到有生成全新影片,也能延长现有影片,或是将遗失的影格补上。
OPENAI在官网上展示了SORA多个应用范例,并公开了这些影片生成的文字指令,其中一个仿若来自真实东京街头场景,一名身着皮衣、红色长裙女人走在街头的影片,OPENAI在影片下方公开其画面指令,无论是影片里出现的女人脸上出现的墨镜、红色口红,街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节,无一不符合该生成影片文字描述。
就在今(16)日凌晨,OPENAI 在 X 上推出一款新生成影片模型“SORA”,可根据文字提示、或是静态图片生成长度一分钟的短影片。尽管目前尚未向市场推出,但其释出的范例影片品质和细节真实度已轰动社群,甚至有网友表示这足以撼动整个影视产业。
(中央社旧金山15日综合外电报导)创造聊天机器人CHATGPT和图像生成器DALL-E的科技公司OPENAI表示,公司正在测试一款由文本转为影片的模型SORA,能让用户透过简单的指令创造出逼真的影片。
人工智能公司OPENAI公布新生成式AI模型“SORA”,可利用根据文字提示生成短影片,现时尚未开放公众使用。
[NEWTALK新闻] OPENAI今(16)日发布了最新的影片生成AI模型SORA(日文“空”罗马拼音),这是一个能够将文字描述转换为长达60秒影片的创新技术,并能够呈现出丰富场景细节、多角色互动和多角度运镜的高品质影片。OPENAI在官网上展示了多个应用范例,影片品质皆具极高水准,并同时公开了这些影片的文字指令。 OPENAI在官网上展示了SORA多个应用范例,并公开了这些影片生成的文字指令,其中一个仿若来自真实东京街头场景,一名身着皮衣、红色长裙女人走在街头的影片,OPENAI在影片下方公开其画面指令,无论是影片里出现的女人脸上出现的墨镜、红色口红,街道潮湿反光、五颜六色的灯光、行人四处走动等场景细节,无一不符合该生成影片文字描述。 而除了真人,SORA还可生成动画角色,其范例中即有一个可爱的毛茸茸小怪物跪在融化红蜡烛旁边的影片,OPENAI也公开该影片的生成文字指令,影片中可爱的小怪物睁大眼睛和张开嘴巴看着红蜡烛,传达出的纯真和俏皮感觉,则完全符合其指令需求。 OPENAI表示,SORA不只能够从文字生成影片,也能够从静态图像或现有影片进行延伸和变化。OPENA解释,该模型对语
OPENAI 官方 X 帐号在今(16)日发布了一则贴文,简单介绍了 SORA AI 模型功能,该模型可以根据使用者提供的文字提示自动生成影片,影片内容可以包含多名角色,搭配特定的动态场景。不过 OPENAI 官方 也强调说 SORA 目前是未完成的产品,可能无法理解复杂的物理或空间细节,导致生成不合逻辑的短影片。
生成式人工智能(GENAI)巨头OPENAI去年藉CHATGPT而为人熟悉,其后也开发出文字、图片各类生成工具。近日OPENAI又有“新搞作”,于昨(15日)公布影片生成AI模型“SORA”。
OPENAI将推出新AI模型 可透过文字生成短影片
OPENAI 日前发布了全新影片生成模型SORA ,让用家可以用文字生成影片。据《MASHABLE》报道,SORA 可以生成 1 分钟的影片,而且这些影片非常逼真,看起来就如真实拍摄般样。网民对 SORA 态度两极,部分网民表示有兴趣试玩 SORA ,另外有网民则表示担心影片制作行业将会式微。
OPENAI 除了有聊天机器人 CHATGPT、AI 文生图工具 DALL-E 3 外,现在也要开始在“AI 影片生成”上发力!日前 OPENAI 宣布推出全新影片生成模型“SORA”,只要透过文字叙述即可生成一部时长 60 秒的超逼真影片。
OPENAI在15日发表的公告中表示,该公司正在教授人工智慧“理解和模拟运动中的物理世界”,希望训练模型帮助人们解决需要现实世界互动的问题。目前OPENAI推出的解决方案,就是文字转化视讯的人工智慧模型SORA:目前SORA已经可以根据用户的文字提示,产生长达一分钟的高品质影片。
经过测试,SORA 可以生成各种风格(包括真实电影,动漫风或黑白)的影片,长度可达一分钟,远远超过目前大多数其他市面上的文字转影片模型,而且这些影片都尽可能在保持合理的连贯性上,像是他们展示的第一款影片中除了文字之外,街上水洼的倒影、衣服随走路的摆动效果,甚至是主角脸上的肌理都栩栩如生。
OPENAI表示,除了将文字转换成影片,SORA也可以把图片动态化生成影片,或是根据现有影片延长补充。OPENAI相信,SORA将是实现通用人工智慧(ARTIFICIAL GENERAL INTELLIGENCE,AGI)的重要里程碑,因为它能深度理解使用者的文字以及现实世界,才能进行精准的影片生成演绎。

流动版 | 完全版
论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南
版权所有 不得转载 (C) 2025 Suntek Computer Systems Limited.
免责声明 : 88iv设立此一网站,旨在以最快捷的方式为公众人士提供清楚准确的最新资料,但在整理资料及编写程式时或会有无心之失。故88iv特此声明,此一网站所载的资料如有任何不确之处、遗漏或误植错字,并引致任何直接或间接的损失或亏损,88iv概不负责,亦不会作出任何赔偿(不论根据侵权法、合约或其他规定亦然)。此外,88iv并不保证本网站所载的资料乃属正确无误及完整无缺,亦不担保可以及时将资料上网及内容适合有关用途。