88IV - Hot News

一日驚艷後翻車？Google「雙子座」大模型6分鍾影片被曝經過了剪輯 @ 2023-12-10T12: Back Hot News

Keyword：模型

Concept：

他告訴貝殼財經記者，要想讓大模型擁有理解圖像影片聲音的「多模態能力」，技術上可以看成把ＬＬＡＶＡ（一種多模態預訓練模型）的圖像理解模塊擴充到了影片和語音上，訓練的時候額外加入影片、音頻數據，「其實就是證明了，雙子座第一次將影片和語音理解做進了大模型里面，驗證了這兩者在大模型上的可行性。」

ＧＯＯＧＬＥ的ＧＥＭＩＮＩ產品分為三種尺寸：ＵＬＴＲＡ、ＰＲＯ和ＮＡＮＯ。其中，ＵＬＴＲＡ是適用於高度復雜任務的最大且最有能力的模型；ＰＲＯ則是跨多種任務進行擴展的最佳模型；而ＮＡＮＯ是專為設備上任務設計的最高效模型。

為了對抗目前ＡＩ界的王者ＯＰＥＮＡＩ，ＧＯＯＧＬＥ今天正式發表了其主力的大型語言模型，取名「ＧＥＭＩＮＩ１．０」。在一篇ＧＯＯＧＬＥ的部落格文章中，ＣＥＯＳＵＮＤＡＲＰＩＣＨＡＩ表示，這是首個「新一代的ＡＩ模型」，並且以「人們理解世界，並且與世界互動的方式」為靈感來源。ＧＥＭＩＮＩ１．０是ＧＯＯＧＬＥ的ＤＥＥＰＭＩＮＤ與研究部門通力合作的成果，在功能上完全不輸目前世面上最先進的ＡＩ模型，ＰＩＣＨＡＩ稱它的能力「在各個領域都是最尖端的」。

事實上，叮當ＨＥＡＬＴＨＧＰＴ大模型的推出，只是醫療大模型競賽的一個縮影。今年以來，伴隨著ＣＨＡＴＧＰＴ的爆火，企業一擁而上，國內外的ＡＩ大模型如雨後春筍般湧現，以革命性姿態沖擊各行各業，這其中就包括醫療產業。

強化ＡＩ模型的三個方法經濟學人《２０２４全球大趨勢》ＡＩ研究的下一步

目前大模型存在感知維度不足、實時性差和泛化能力弱等問題。感知方面，現有大模型主要包含視覺感知，以學習雕刻為例，僅依靠觀摩而不動手操作，很難徹底掌握這門工藝，因此多模態感知是必然趨勢；運控方面，現有大模型的指令生成速度較慢、生成結果簡單，短期來看，底層運控仍需依靠傳統機器人算法；泛化能力方面，ＲＴ-２在未知復雜環境中的執行成功率僅為３５％。該行認為，未來需依靠訓練模型結構、訓練方法和數據集的改進，將更多模態感知模態納入模型，同時提高運控指令的生成速度和泛化能力。

航母福建號新照曝光彈射車和殲３５模型同現身

百「模」大戰開打當前，中國大模型呈現蓬勃發展趨勢，相關技術近年沿著各技術路線迅速發展，在自然語言處理、機器視覺和多模態機器學習等領域，湧現出多個具有行業影響力的預訓練大模型。科技部發表的《中國人工智能大模型地圖研究報告》顯示，從全球已經發布的大模型數量來看，合計有約８０％來自中美兩國，美國居全球之首，中國目前已進入大模型快速發展期。據聞截至今年５月，中國１０億參數規模以上的大模型已發布７９個。現時中國在１４個省市/地區均有團隊開展大模型研發，其中以北京和廣東兩地最多，按領域分布來看，自然語言處理仍是目前大模型研發最為活躍的重點領域，其次是多模態領域，計算機視覺和智能語音等領域的大模型相對少。

谷歌行政總裁桑達爾·皮查伊在一篇博文中寫道：「這個新模型代表了我們作為一家科技公司所做的最大的科學和工程努力之一，它也是一個多模態基礎模型，可以概括和理解不同類型的信息，包括文本、代碼、音頻、圖像和視頻。」

不論你是游戲、模型或漫畫愛好者，應該都曾經想像過一個放滿自己收藏品的夢幻房間吧？最近日本一位兩個孩子的父親，他同時也是鋼彈模型（鋼普拉）收藏家，分享了專門用來放置模型的「鋼彈模型房間」，引起許多網友的羨慕。

２)美圖視覺大模型ＭＩＲＡＣＬＥＶＩＳＩＯＮ將與美圖天使輪領投的ＷＥＩＴＵ公司研發的大語言模型開展深度融合，共同為影像與設計產品提供底層服務，這將有效提高ＭＩＲＡＣＬＥＶＩＳＩＯＮ自認語言理解和多模態能力。

認為，多模態ＧＥＭＩＮＩ模型的正式發布，一方面可以拓寬應用場景的拓展，另一方面能夠帶來算力需求的持續升級。持續看好後續ＡＩ產業的前景，認為後續ＧＰＴ-５等模型的發布亦將帶來更多的催化。

更強大的模型能力：依托商湯行業領先的大語言模型，它具備卓越的代碼生成能力和強大的中文理解能力。在權威測試集ＨＵＭＡＮＥＶＡＬ的測試中，一次通過率達到７１％，大幅超過ＧＰＴ-３．５。

路透報導，根據一份外洩文件，歐盟人工智慧法案（ＡＩＡＣＴ）可能會排除對開放原始碼模型的監管。圖為ＣＨＡＴＧＰＴ的開發商ＯＰＥＮＡＩ。圖／路透

搜尋引擎巨擘谷歌，日前推出號稱最強大的生成式ＡＩ模型「ＧＥＭＩＮＩ」雙子星，正面挑戰ＯＰＥＮＡＩ最新版本ＧＰＴ-４，ＧＥＭＩＮＩ被建構為「多模式ＡＩ模型」，簡單來說，它是一個能同時處理文字、圖片、聲音、影像和程式碼的聊天機器人。

如此熱門作品當然會有不少二創，然而上周在香港的旋轉拍賣上，就有模型師未經許可之下把２０１６年的知名二創「大雄貫穿胖虎」制作成模型並販售，消息一出也引發二創圖繪師不滿喊到，「拜托別把我拖下水。」（點擊放大瀏覽）▼▼▼

美國首領失業救濟人數符合預期，市場期待周五公布的１１月非農就業報告。美股主要指數周四（７日）上升，道指收市升６２點。ＧＯＯＧＬＥ母公司ＡＬＰＨＡＢＥＴ推出新人工智能（ＡＩ）模型，股價至收市升５．３１％；ＮＶＩＤＩＡ、ＡＭＡＺＯＮ、ＭＥＴＡ等科技股也上揚，帶動納指升１．３７％。

ＰＹＴＯＲＣＨ２．０中有一個重要功能更新是動態形狀（ＤＹＮＡＭＩＣＳＨＡＰＥ），該功能允許模型在推理時處理可變大小的輸入，這代表模型不必在訓練時，就確定所有輸入資料精確的形狀，進而增加了模型的靈活性和應用范圍，對於需要處理各種大小輸入的應用，像是文字或是圖像處理，這是一個相當重要的功能。

Mobile | Full

Forum rule | About Us | Contact Info | Terms & Conditions | Privacy Statment | Disclaimer | Site Map

Copyright (C) 2025 Suntek Computer Systems Limited. All rights reserved

Disclaimer : In the preparation of this website, 88iv endeavours to offer the most current, correct and clearly expressed information to the public. Nevertheless, inadvertent errors in information and in software may occur. In particular but without limiting anything here, 88iv disclaims any responsibility and accepts no liability (whether in tort, contract or otherwise) for any direct or indirect loss or damage arising from any inaccuracies, omissions or typographical errors that may be contained in this website. 88iv also does not warrant the accuracy, completeness, timeliness or fitness for purpose of the information contained in this website.