分享此頁

熱門新聞

OpenAI推Sora 文字可生成影片- 20240217 - 經濟 @ 2024-02-18T08: 返回 熱門新聞
關鍵詞:影片 生成 文字 模型
概念:文字生成影片模型
說到文字生成影片的 AI 模型,META、GOOGLE、RUNWAY 等都其實也有,甚至有提供公眾使用,不過 OPEN AI 的 SORA 是目前唯一能生成 60 秒長的內容,而且是整段影片一口氣生成,而非像其他模型般逐格生成再連續播放。
OPENAI名為SORA的新人工智能模型可以根據文本提示生成細節豐富的影片。該技術在令許多人驚歎的同時也引發了混淆視聽的擔憂。OPENAI表示,一組研究人員將找出該工具可能被濫用的方式來予以防范。OPENAI旗下的人工智能工具包括CHATGPT。封面圖片來源:OPENAI
OPENAI表示,SORA目前為未完成的產品,可能難以消化復雜的物理或空間細節,導致生成不合邏輯的影片,例如:人在跑步機上可能跑錯方向,或博物館影片中地板會「移動」及影片中被咬的餅干不會出現被咬過後的缺口等,目前僅對正在評估潛在危害和風險的「紅隊成員」開放,以幫助識別系統中的缺陷,藉此獲得使用回饋。依照OPEN AI技術推進及AI成長速度,一般預料,明年文字生成影片這項功能,就會有機會進入一般消費者可以使用存取的應用階段。
【明報專訊】CHATGPT母企OPENAI公布開發了全新的AI模型SORA(日文指天空),它可根據文字提示,生成1分鍾的高清影片,又或基於靜態圖像生成影片,並可在原有的影片加入新的影像。該模型暫未對外開放,目前僅供少數研究員及電影制作人使用,以評估該模型被濫用的風險。OPENAI正測試用戶能否繞過其服務條款限制,生成違規的極端暴力、色情、仇恨或侵權影像。部分影片制作者憂慮,新模型令影視業者飯碗不保。
從技術層面而言,SORA是一個擴散模型,能從一個看似靜態噪音(STATIC NOISE)的影格開始,逐步透過去除噪音生成一則影片。SORA是在DALL-E及GPT模型的研究基礎上發展,它使用DALL-E 3的重描述(RECAPTIONING)技術,能為視覺訓練資料產生高度描述文字,因此能依循用戶文字指令產生影片。除了根據文字指示外,該模型也能將靜態圖片動態化以生成影片。SORA能從無到有生成全新影片,也能延長現有影片,或是將遺失的影格補上。
OPENAI 的 SORA 模型可以透過輸入文字或者圖片自動生成長達 60 秒的影片,從示范片段中可見,生成的影片無論在畫質、影片中物件的連貫性以及對人體和物理環境的描繪准確度都相當強勁,相對於 RUNWAY、PIKA 和 STABILITY AI 等初創公司的類似模型,以及 GOOGLE 的 LUMIERE 模型等都有優勢。OPENAI 指,SORA 使用的技術是基於過往開發 DALL-E 和 GPT 系列模型的經驗,基於 TRANSFORMER 架構開發,能夠在流暢度和畫質上帶來極佳表現。
生成式人工智能(GENAI)巨頭OPENAI去年藉CHATGPT而為人熟悉,其後也開發出文字、圖片各類生成工具。近日OPENAI又有「新搞作」,於昨(15日)公布影片生成AI模型「SORA」。
外媒報道,人工智能(AI)公司OPENAI正在開發一款可以「文字轉影片」的AI模型「SORA」,原理和OPENAI的圖像生成AI工具DALL-E類似,透過使用者輸入的文字提示來生成影片,目前僅能生成最多1分鍾的影片。
就在今(16)日凌晨,OPENAI 在 X 上介紹一款名為 SORA 的新模型,其建立在 DALL·E 和 GPT 模型的研究之上,可根據文字提示生成長度一分鍾的影片。盡管目前尚未向市場推出,但釋出的范例影片已引起社群廣泛討論。
OPENAI在官網上展示了SORA多個應用范例,並公開了這些影片生成的文字指令,其中一個仿若來自真實東京街頭場景,一名身著皮衣、紅色長裙女人走在街頭的影片,OPENAI在影片下方公開其畫面指令,無論是影片里出現的女人臉上出現的墨鏡、紅色口紅,街道潮濕反光、五顏六色的燈光、行人四處走動等場景細節,無一不符合該生成影片文字描述。
創造聊天機械人CHATGPT的人工智能(AI)公司OPENAI,今日(16日)公布推出一款名為「SORA」的影片生成工具模型,能根據使用者給予的文字指令生成短影片,片長度最多60秒,也可依據靜態圖像制作動畫。
CHATGPT開發商OPENAI發布影片生成模型「SORA」,展示多條基於文字生成的AI生成影片
生成影片的AI其實並不新鮮,從GOOGLE、META等科技巨頭到成立不滿一年的新創PIKA LABS等公司,都發表過生成影片的AI技術。而SORA最大的特點在於極其逼真,外媒《WIRED》聲稱,這是沒有在其他影片生成AI模型中看見過的真實感,並且生成的影片長於其他模型。
人工智能公司OPENAI公布新生成式AI模型「SORA」,可利用根據文字提示生成短影片,現時尚未開放公眾使用。
OPENAI 官方 X 帳號在今(16)日發布了一則貼文,簡單介紹了 SORA AI 模型功能,該模型可以根據使用者提供的文字提示自動生成影片,影片內容可以包含多名角色,搭配特定的動態場景。不過 OPENAI 官方 也強調說 SORA 目前是未完成的產品,可能無法理解復雜的物理或空間細節,導致生成不合邏輯的短影片。
經過測試,SORA 可以生成各種風格(包括真實電影,動漫風或黑白)的影片,長度可達一分鍾,遠遠超過目前大多數其他市面上的文字轉影片模型,而且這些影片都盡可能在保持合理的連貫性上,像是他們展示的第一款影片中除了文字之外,街上水窪的倒影、衣服隨走路的擺動效果,甚至是主角臉上的肌理都栩栩如生。
OPENAI將推出新AI模型 可透過文字生成短影片
(中央社舊金山15日綜合外電報導)創造聊天機器人CHATGPT和圖像生成器DALL-E的科技公司OPENAI表示,公司正在測試一款由文本轉為影片的模型SORA,能讓用戶透過簡單的指令創造出逼真的影片。
OPENAI在15日發表的公告中表示,該公司正在教授人工智慧「理解和模擬運動中的物理世界」,希望訓練模型幫助人們解決需要現實世界互動的問題。目前OPENAI推出的解決方案,就是文字轉化視訊的人工智慧模型SORA:目前SORA已經可以根據用戶的文字提示,產生長達一分鍾的高品質影片。

流動版 | 完全版
論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明 | 網頁指南
版權所有 不得轉載 (C) 2025 Suntek Computer Systems Limited.
免責聲明 : 88iv設立此一網站,旨在以最快捷的方式為公眾人士提供清楚準確的最新資料,但在整理資料及編寫程式時或會有無心之失。故88iv特此聲明,此一網站所載的資料如有任何不確之處、遺漏或誤植錯字,並引致任何直接或間接的損失或虧損,88iv概不負責,亦不會作出任何賠償(不論根據侵權法、合約或其他規定亦然)。此外,88iv並不保證本網站所載的資料乃屬正確無誤及完整無缺,亦不擔保可以及時將資料上網及內容適合有關用途。