熱門新聞

【兩會聚焦】新通義千問比肩DeepSeek-R1 阿里巴巴勁升8% 「人工智能+」發力掀國產大模型競逐- 財經 - 香港文匯網 @ 2025-03-07T 返回 熱門新聞
關鍵詞:阿里 模型
概念:阿里巴巴股價 , 阿里開源推理模型通義千問
阿里通義千問QWQ-32B是一款擁有320億參數的模型,在數學、代碼及通用能力上實現質的飛躍,用更小參數實現整體性能媲美DEEPSEEK-R1,並突破性地讓高性能推理模型在消費級顯卡上實現本地部署,大幅降低模型應用成本。
阿里(9988)旗下通義千問QWEN團隊推出QWQ-32B大語言模型,據稱其性能媲美擁有6,710億參數的DEEPSEEK-R1(其中370億被激活),更在某些測試中超越了對方。受消息影響,阿里股價今早曾升逾7%至139.6元;暫報138.2元,續升逾6%。
阿里雲表示,這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中,阿里雲計劃將更強大的基礎模型與依托規模化計算資源的 RL 相結合,從而使其更接近實現人工通用智能(AGI)。此外,阿里雲正積極探索將智能體與 RL 集成,以實現長時推理,目標是通過推理時間擴展來釋放更高的智能。 (LF)
阿里巴巴發布了通義千問QWQ-32B模型,參數數量達到320,與DEEPSEEK R1相當,但後者參數數量為QWQ-32B的20倍。

 

易發投資 | 首頁 |  登錄
流動版 | 完全版
論壇守則 | 關於我們 | 聯繫方式 | 服務條款 | 私隱條款 | 免責聲明
版權所有 不得轉載 (C) 2025
Suntek Computer Systems Limited.