分享此頁

熱門新聞

【兩會聚焦】新通義千問比肩DeepSeek-R1 阿里巴巴勁升8% 「人工智能+」發力掀國產大模型競逐- 財經 - 香港文匯網 @ 2025-03-07T 返回 熱門新聞
關鍵詞:阿里 模型
概念:阿里巴巴股價 , 阿里開源推理模型通義千問
阿里通義千問QWQ-32B是一款擁有320億參數的模型,在數學、代碼及通用能力上實現質的飛躍,用更小參數實現整體性能媲美DEEPSEEK-R1,並突破性地讓高性能推理模型在消費級顯卡上實現本地部署,大幅降低模型應用成本。
阿里(9988)旗下通義千問QWEN團隊推出QWQ-32B大語言模型,據稱其性能媲美擁有6,710億參數的DEEPSEEK-R1(其中370億被激活),更在某些測試中超越了對方。受消息影響,阿里股價今早曾升逾7%至139.6元;暫報138.2元,續升逾6%。
阿里雲表示,這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中,阿里雲計劃將更強大的基礎模型與依托規模化計算資源的 RL 相結合,從而使其更接近實現人工通用智能(AGI)。此外,阿里雲正積極探索將智能體與 RL 集成,以實現長時推理,目標是通過推理時間擴展來釋放更高的智能。 (LF)
阿里巴巴發布了通義千問QWQ-32B模型,參數數量達到320,與DEEPSEEK R1相當,但後者參數數量為QWQ-32B的20倍。

流動版 | 完全版
論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明 | 網頁指南
版權所有 不得轉載 (C) 2025 Suntek Computer Systems Limited.
免責聲明 : 88iv設立此一網站,旨在以最快捷的方式為公眾人士提供清楚準確的最新資料,但在整理資料及編寫程式時或會有無心之失。故88iv特此聲明,此一網站所載的資料如有任何不確之處、遺漏或誤植錯字,並引致任何直接或間接的損失或虧損,88iv概不負責,亦不會作出任何賠償(不論根據侵權法、合約或其他規定亦然)。此外,88iv並不保證本網站所載的資料乃屬正確無誤及完整無缺,亦不擔保可以及時將資料上網及內容適合有關用途。