熱門新聞

GROQ和沙特的Humain宣布了Openai最新型號的零推出 @ 2025-08-06T 返回 熱門新聞
關鍵詞:模型
概念:開放權重模型
最新釋出的模型包含GPT-OSS-120B及GPT-OSS-20B。GPT-OSS-120B號稱是該公司最強大的開放權重模型,適合單一H100 GPU平台。GPT-OSS-20B則為中等規模的開放模型,適合低延遲性應用。二者都是以寬松APACHE 2.0授權開放,允許使用者自由開放,適合實驗、客制或商用部署。
嚴格來說,OPENAI此次發布的開放權重模型並不等同於開源模型。因為GPT-OSS系列公開了其訓練參數,讓開發者能夠基於這些權重對模型進行定制,但未公布訓練數據、訓練流程等核心細節。開放權重是當前開源模型社區采用的主流方式,包括META的LLAMA模型、DEEPSEEK、阿里QWEN系列等模型。
OPENAI發布兩個開放權重模型
OPENAI向開源模型邁出重要一步:六年來首次推出開放權重模型。
8月6日|亞馬遜雲科技宣布,OPENAI的開放權重權重首次可通過AMAZON BEDROCK和AMAZON SAGEMAKER AI訪問,幫助客戶快速構建生成式AI應用。OPENAI最新發布兩款開放權重基礎模型GPT-OSS-120B與GPT-OSS-20B。在AMAZON BEDROCK上運行的兩個開放權重模型中的大尺寸模型,在性價比方面是同類GEMINI模型的3倍、DEEPSEEK-R1的5倍以及OPENAI O4模型的2倍。
支援的MISTRAL AI和中國新創公司DEEPSEEK在內多家科技公司,近年亦發布了開放權重模型。(SW/T)(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鍾。)
這場「重歸開放」的轉身,其實早有鋪墊。2025年至今,META不斷強化LLAMA模型在開源社區的影響力,MISTRAL、COHERE等新興公司也紛紛布局開放權重模型。而中國本土AI企業DEEPSEEK,於2025年1月推出的DEEPSEEK-R1模型,在推理能力和開源協議上的突破,也被認為是「壓迫OPENAI不得不應戰」的關鍵誘因之一。
OPENAI發布六年來首批開放權重模型
OPENAI終於交出了它的開放權重模型作業:GPT-OSS,一個13B參數的密集模型。這並非一個能與GPT-4O或CLAUDE 4.1匹敵的SOTA模型,其性能大致對標LLAMA 3 8B或QWEN2 7B。在一些基准測試上,它的表現甚至略遜於同量級對手。
對此,亞馬遜雲科技產品總監ATUL DEO稱:「開放權重模型將在生成式AI發展中發揮關鍵作用,這是我們此次推出OPENAI模型的原因。」OPENAI產品負責人DMITRY PIMENOV則表示,開放權重模型面向從個人開發者到大型企業用戶,通過與AMAZON的合作,將幫助更多客戶以更快速度構建和部署AI應用。(袁寧)
與API中的OPENAI O系列推理模型類似,兩個開放權重模型都支持低、中、高三種推理強度設置,允許開發者根據具體使用場景和延遲需求在性能與響應速度之間進行權衡。
OPENAI發布GPT-OSS-120B和GPT-OSS-20B兩款開源模型,這是自2019年GPT-2以來首次發布開放權重模型。用戶可下載到本地硬件運行,支持模擬推理、工具使用和深度定制。小模型需16GB內存,大模型需80GB內存。兩款模型均采用混合專家架構,支持可配置的思維鏈,上下文窗口為128000個TOKEN。性能接近專有雲模型,但僅支持文本處理。

 

易發投資 | 首頁 |  登錄
流動版 | 完全版
論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明
版權所有 不得轉載 (C) 2025
Suntek Computer Systems Limited.