易發投資 - 熱門新聞

分享此頁

OpenAI推Sora 文字可生成影片- 20240217 - 經濟 @ 2024-02-18T08: 返回熱門新聞

關鍵詞：影片生成文字模型

概念：文字生成影片模型

說到文字生成影片的ＡＩ模型，ＭＥＴＡ、ＧＯＯＧＬＥ、ＲＵＮＷＡＹ等都其實也有，甚至有提供公眾使用，不過ＯＰＥＮＡＩ的ＳＯＲＡ是目前唯一能生成６０秒長的內容，而且是整段影片一口氣生成，而非像其他模型般逐格生成再連續播放。

ＯＰＥＮＡＩ名為ＳＯＲＡ的新人工智能模型可以根據文本提示生成細節豐富的影片。該技術在令許多人驚歎的同時也引發了混淆視聽的擔憂。ＯＰＥＮＡＩ表示，一組研究人員將找出該工具可能被濫用的方式來予以防范。ＯＰＥＮＡＩ旗下的人工智能工具包括ＣＨＡＴＧＰＴ。封面圖片來源：ＯＰＥＮＡＩ

ＯＰＥＮＡＩ表示，ＳＯＲＡ目前為未完成的產品，可能難以消化復雜的物理或空間細節，導致生成不合邏輯的影片，例如：人在跑步機上可能跑錯方向，或博物館影片中地板會「移動」及影片中被咬的餅干不會出現被咬過後的缺口等，目前僅對正在評估潛在危害和風險的「紅隊成員」開放，以幫助識別系統中的缺陷，藉此獲得使用回饋。依照ＯＰＥＮＡＩ技術推進及ＡＩ成長速度，一般預料，明年文字生成影片這項功能，就會有機會進入一般消費者可以使用存取的應用階段。

【明報專訊】ＣＨＡＴＧＰＴ母企ＯＰＥＮＡＩ公布開發了全新的ＡＩ模型ＳＯＲＡ（日文指天空），它可根據文字提示，生成１分鍾的高清影片，又或基於靜態圖像生成影片，並可在原有的影片加入新的影像。該模型暫未對外開放，目前僅供少數研究員及電影制作人使用，以評估該模型被濫用的風險。ＯＰＥＮＡＩ正測試用戶能否繞過其服務條款限制，生成違規的極端暴力、色情、仇恨或侵權影像。部分影片制作者憂慮，新模型令影視業者飯碗不保。

從技術層面而言，ＳＯＲＡ是一個擴散模型，能從一個看似靜態噪音（ＳＴＡＴＩＣＮＯＩＳＥ）的影格開始，逐步透過去除噪音生成一則影片。ＳＯＲＡ是在ＤＡＬＬ-Ｅ及ＧＰＴ模型的研究基礎上發展，它使用ＤＡＬＬ-Ｅ３的重描述（ＲＥＣＡＰＴＩＯＮＩＮＧ）技術，能為視覺訓練資料產生高度描述文字，因此能依循用戶文字指令產生影片。除了根據文字指示外，該模型也能將靜態圖片動態化以生成影片。ＳＯＲＡ能從無到有生成全新影片，也能延長現有影片，或是將遺失的影格補上。

ＯＰＥＮＡＩ的ＳＯＲＡ模型可以透過輸入文字或者圖片自動生成長達６０秒的影片，從示范片段中可見，生成的影片無論在畫質、影片中物件的連貫性以及對人體和物理環境的描繪准確度都相當強勁，相對於ＲＵＮＷＡＹ、ＰＩＫＡ和ＳＴＡＢＩＬＩＴＹＡＩ等初創公司的類似模型，以及ＧＯＯＧＬＥ的ＬＵＭＩＥＲＥ模型等都有優勢。ＯＰＥＮＡＩ指，ＳＯＲＡ使用的技術是基於過往開發ＤＡＬＬ-Ｅ和ＧＰＴ系列模型的經驗，基於ＴＲＡＮＳＦＯＲＭＥＲ架構開發，能夠在流暢度和畫質上帶來極佳表現。

生成式人工智能（ＧＥＮＡＩ）巨頭ＯＰＥＮＡＩ去年藉ＣＨＡＴＧＰＴ而為人熟悉，其後也開發出文字、圖片各類生成工具。近日ＯＰＥＮＡＩ又有「新搞作」，於昨（１５日）公布影片生成ＡＩ模型「ＳＯＲＡ」。

外媒報道，人工智能(ＡＩ)公司ＯＰＥＮＡＩ正在開發一款可以「文字轉影片」的ＡＩ模型「ＳＯＲＡ」，原理和ＯＰＥＮＡＩ的圖像生成ＡＩ工具ＤＡＬＬ-Ｅ類似，透過使用者輸入的文字提示來生成影片，目前僅能生成最多１分鍾的影片。

就在今（１６）日凌晨，ＯＰＥＮＡＩ在Ｘ上介紹一款名為ＳＯＲＡ的新模型，其建立在ＤＡＬＬ·Ｅ和ＧＰＴ模型的研究之上，可根據文字提示生成長度一分鍾的影片。盡管目前尚未向市場推出，但釋出的范例影片已引起社群廣泛討論。

ＯＰＥＮＡＩ在官網上展示了ＳＯＲＡ多個應用范例，並公開了這些影片生成的文字指令，其中一個仿若來自真實東京街頭場景，一名身著皮衣、紅色長裙女人走在街頭的影片，ＯＰＥＮＡＩ在影片下方公開其畫面指令，無論是影片里出現的女人臉上出現的墨鏡、紅色口紅，街道潮濕反光、五顏六色的燈光、行人四處走動等場景細節，無一不符合該生成影片文字描述。

創造聊天機械人ＣＨＡＴＧＰＴ的人工智能（ＡＩ）公司ＯＰＥＮＡＩ，今日（１６日）公布推出一款名為「ＳＯＲＡ」的影片生成工具模型，能根據使用者給予的文字指令生成短影片，片長度最多６０秒，也可依據靜態圖像制作動畫。

ＣＨＡＴＧＰＴ開發商ＯＰＥＮＡＩ發布影片生成模型「ＳＯＲＡ」，展示多條基於文字生成的ＡＩ生成影片

生成影片的ＡＩ其實並不新鮮，從ＧＯＯＧＬＥ、ＭＥＴＡ等科技巨頭到成立不滿一年的新創ＰＩＫＡＬＡＢＳ等公司，都發表過生成影片的ＡＩ技術。而ＳＯＲＡ最大的特點在於極其逼真，外媒《ＷＩＲＥＤ》聲稱，這是沒有在其他影片生成ＡＩ模型中看見過的真實感，並且生成的影片長於其他模型。

人工智能公司ＯＰＥＮＡＩ公布新生成式ＡＩ模型「ＳＯＲＡ」，可利用根據文字提示生成短影片，現時尚未開放公眾使用。

ＯＰＥＮＡＩ官方Ｘ帳號在今（１６）日發布了一則貼文，簡單介紹了ＳＯＲＡＡＩ模型功能，該模型可以根據使用者提供的文字提示自動生成影片，影片內容可以包含多名角色，搭配特定的動態場景。不過ＯＰＥＮＡＩ官方也強調說ＳＯＲＡ目前是未完成的產品，可能無法理解復雜的物理或空間細節，導致生成不合邏輯的短影片。

經過測試，ＳＯＲＡ可以生成各種風格（包括真實電影，動漫風或黑白）的影片，長度可達一分鍾，遠遠超過目前大多數其他市面上的文字轉影片模型，而且這些影片都盡可能在保持合理的連貫性上，像是他們展示的第一款影片中除了文字之外，街上水窪的倒影、衣服隨走路的擺動效果，甚至是主角臉上的肌理都栩栩如生。

ＯＰＥＮＡＩ將推出新ＡＩ模型可透過文字生成短影片

（中央社舊金山１５日綜合外電報導）創造聊天機器人ＣＨＡＴＧＰＴ和圖像生成器ＤＡＬＬ-Ｅ的科技公司ＯＰＥＮＡＩ表示，公司正在測試一款由文本轉為影片的模型ＳＯＲＡ，能讓用戶透過簡單的指令創造出逼真的影片。

ＯＰＥＮＡＩ在１５日發表的公告中表示，該公司正在教授人工智慧「理解和模擬運動中的物理世界」，希望訓練模型幫助人們解決需要現實世界互動的問題。目前ＯＰＥＮＡＩ推出的解決方案，就是文字轉化視訊的人工智慧模型ＳＯＲＡ：目前ＳＯＲＡ已經可以根據用戶的文字提示，產生長達一分鍾的高品質影片。

流動版 | 完全版

論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明 | 網頁指南

版權所有不得轉載 (C) 2025 Suntek Computer Systems Limited.

免責聲明 : 88iv設立此一網站，旨在以最快捷的方式為公眾人士提供清楚準確的最新資料，但在整理資料及編寫程式時或會有無心之失。故88iv特此聲明，此一網站所載的資料如有任何不確之處、遺漏或誤植錯字，並引致任何直接或間接的損失或虧損，88iv概不負責，亦不會作出任何賠償（不論根據侵權法、合約或其他規定亦然）。此外，88iv並不保證本網站所載的資料乃屬正確無誤及完整無缺，亦不擔保可以及時將資料上網及內容適合有關用途。