Hot News

【兩會聚焦】新通義千問比肩DeepSeek-R1 阿里巴巴勁升8% 「人工智能+」發力掀國產大模型競逐- 財經 - 香港文匯網 @ 2025-03-07T Back Hot News
Keyword:阿里 模型
Concept:阿里巴巴股價 , 阿里開源推理模型通義千問
阿里通義千問QWQ-32B是一款擁有320億參數的模型,在數學、代碼及通用能力上實現質的飛躍,用更小參數實現整體性能媲美DEEPSEEK-R1,並突破性地讓高性能推理模型在消費級顯卡上實現本地部署,大幅降低模型應用成本。
阿里(9988)旗下通義千問QWEN團隊推出QWQ-32B大語言模型,據稱其性能媲美擁有6,710億參數的DEEPSEEK-R1(其中370億被激活),更在某些測試中超越了對方。受消息影響,阿里股價今早曾升逾7%至139.6元;暫報138.2元,續升逾6%。
阿里雲表示,這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中,阿里雲計劃將更強大的基礎模型與依托規模化計算資源的 RL 相結合,從而使其更接近實現人工通用智能(AGI)。此外,阿里雲正積極探索將智能體與 RL 集成,以實現長時推理,目標是通過推理時間擴展來釋放更高的智能。 (LF)
阿里巴巴發布了通義千問QWQ-32B模型,參數數量達到320,與DEEPSEEK R1相當,但後者參數數量為QWQ-32B的20倍。

 

88iv | Home |  Login
Mobile | Full
Forum rule | About Us | Contact Info | Terms & Conditions | Privacy Statment | Disclaimer
Copyright (C) 2025
Suntek Computer Systems Limited.
All rights reserved