熱門新聞

GPT會沖擊多鄰國嗎?大摩:語言學習最大的挑戰是「動機」,AI不是競爭者而是加速器! @ 2025-08-09T 返回 熱門新聞
關鍵詞:模型
概念:
所謂「開放權重」意味著模型的訓練權重參數可供任何人使用,其優勢在於能省去訓練的數據、時間成本,可讓你直接獲得模型的能力。至於這些能力是如何訓練出來的,從開放權重模型里沒法找到答案。相比更常被人談論的開源模型,開放權重模型在透明度和修改彈性上皆有差距(不給你程式碼和訓練邏輯),但勝在易用,對開發人員來說是很好的即戰力。
一體機首次實現推理模型、通用模型、多模態模型、語言合成/識別模型、嵌入模型、重排模型、文生圖模型的預設、調用、加速、管理和反覆運算,實現與應用場景的深度融合。其功能的突破體現在四個維度:
日本今夏「猛暑」幾乎籠罩全國,多地高溫打破紀錄,並且頻發中暑警戒警報,連餐廳擺設的食物模型都被曬到融化。當地網民便分享一張餐廳櫥窗拉面模型不敵高溫融化的照片,只見拉面模型里的湯汁流出,吸引近2700萬人點擊。
香港 - MEDIA OUTREACH NEWSWIRE - 2025年8月6日 - AWS宣布,OPENAI 的開放權重模型將首次透過 AMAZON BEDROCK 和 AMAZON SAGEMAKER AI 存取,讓客戶能夠快速地建構生成式人工智能(GENERATIVE AI) 應用。OPENAI 的兩款全新開放權重基礎模型 — GPT-OSS-120B 和 GPT-OSS-20B — 將為企業提供更強大的AI技術,並透過全球服務最豐富、應用最廣泛的AWS雲端服務,將 OPENAI 的領先技術擴展至數百萬 AWS 客戶。在 AMAZON BEDROCK 上運行的兩款開放權重模型中,較大的一款性價比是同類型 GEMINI 模型的 3 倍、DEEPSEEK-R1 的 5 倍,以及同類型 OPENAI O4 模型的 2 倍。是次發布延續了 AWS 在模型選擇方面的承諾,不僅增強了 AMAZON BEDROCK 中現有廣泛的全托管模型選擇,亦透過 AMAZON SAGEMAKER JUMPSTART 提供更多存取選擇,並進一步體現AWS 在生成式 AI 技術方面的持續創新,以滿足客戶需求。
企業部署開源 AI 時需考慮幾個關鍵因素。技術團隊需具備足夠專業知識進行模型客制化和維護,因為開源模型主要依賴社群支援而非供應商服務。安全性方面,開放存取可能令模型更容易受到誤用或網絡威脅,企業需建立完善的安全措施。OPENAI 表示已對 GPT-OSS 模型進行嚴格安全評估,確保模型不會被惡意行為者利用於網絡攻擊或生化武器開發。
一名日本網民在社交平台分享,一間餐廳在櫥窗擺設的食物模型,疑似不敵高溫曝曬而當場融化。食材模型隨著湯碗的傾斜角度而流出。這張照片分享至今點擊率超過
如預告的一樣,OPENAI 在前天的開放權重模型後,於今日正式發布了萬眾期待的 GPT-5。這是他們 2 年半來首次推出的大版本號升級,因此 GPT-5 在各方面全面強化也是理所應當。首先,這是首款將推理模型作為預設選項的 GPT。它不像過去那樣設置了模型選擇器,當你和 GPT-5 對話時,它會透過「自動切換器」判斷你的意圖,並決定是以高效聊天(針對一般查詢)還是深度推里(針對有調整的提問或任務)模型進行回應。
JONATHAN ROSS 表示:「OPENAI 正在於開源模型中,設定最新高效能標准。GROQ 是為了運行這樣速度快兼成本低的模型而建造,因此世界各地的開發人員從一開始便可使用它們。我們與 HUMAIN 的合作增強沙地阿拉伯王國的當地存取和支援,協助該區的開發人員更智能兼更快速地建立應用程式。」
行政總裁阿爾特曼(SAM ALTMAN)稱,GPT-5是OPENAIAI模型的重大升級,是一款整合模型,意味著不再需要模型切換功能,會自主判斷何時需要更深入思考。
GOOGLE DEEPMIND團隊正努力打造不同類型的模型,最新就帶來了名為「GENIE 3」的世界模型(WORLD MODEL),用戶只需要輸入簡單的文字提示,便可生成「數分鍾」模擬物理特性、可互動的世界。
市場預測,OPENAI 除了將推出 GPT-5 主要模型,可能也會同步發表輕量級的 GPT-5 MINI 與 GPT-5 NANO,讓開發者與一般使用者能依不同需求與運算資源,選擇最合適的模型版本,並且能布署應用在如筆電、 手機等終端裝置。這樣的配置策略,也與在 GPT-4.1 系列中出現多模型階層的做法相呼應。
OPENAI 相隔六年終於再一次發布開放權重模型,而且是效能聲稱可媲美高階推理模型 O4-MINI 的 GPT-OSS-120B 以及媲美 O3-MINI 的 GPT-OSS-20B,就看你家里的電腦規格而決定部署哪一款。使用授權會為較彈活的 APACHE 2.0,甚至可以作商用用途。
港鐵介紹兩套創科研發的客流預測及分流方案,其中「客流預測模型」透過分析數十億組數據,包括全港交通習慣調查數據、大球場及紅館活動期間的乘客數據等,建立數位孿生模型。模型會設定不同營運場景作線上演練,預測乘客網絡分布及出行路線,驗證列車班次密度能否消化散場人流。

 

易發投資 | 首頁 |  登錄
流動版 | 完全版
論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明
版權所有 不得轉載 (C) 2025
Suntek Computer Systems Limited.