易发投资 - 新闻热点

【两会聚焦】新通义千问比肩DeepSeek-R1 阿里巴巴劲升8% “人工智能+”发力掀国产大模型竞逐- 财经 - 香港文汇网 @ 2025-03-07T 返回新闻热点

关键词：阿里模型

概念：阿里巴巴股价 , 阿里开源推理模型通义千问

阿里通义千问ＱＷＱ-３２Ｂ是一款拥有３２０亿参数的模型，在数学、代码及通用能力上实现质的飞跃，用更小参数实现整体性能媲美ＤＥＥＰＳＥＥＫ-Ｒ１，并突破性地让高性能推理模型在消费级显卡上实现本地部署，大幅降低模型应用成本。

阿里（９９８８）旗下通义千问ＱＷＥＮ团队推出ＱＷＱ-３２Ｂ大语言模型，据称其性能媲美拥有６,７１０亿参数的ＤＥＥＰＳＥＥＫ-Ｒ１（其中３７０亿被激活），更在某些测试中超越了对方。受消息影响，阿里股价今早曾升逾７％至１３９．６元；暂报１３８．２元，续升逾６％。

阿里云表示，这是“通义千问”在大规模强化学习(ＲＬ)以增强推理能力方面的第一步。在致力开发下一代“通义千问”的过程中，阿里云计划将更强大的基础模型与依托规模化计算资源的ＲＬ相结合，从而使其更接近实现人工通用智能(ＡＧＩ)。此外，阿里云正积极探索将智能体与ＲＬ集成，以实现长时推理，目标是通过推理时间扩展来释放更高的智能。 (ＬＦ)

阿里巴巴发布了通义千问ＱＷＱ-３２Ｂ模型，参数数量达到３２０，与ＤＥＥＰＳＥＥＫＲ１相当，但后者参数数量为ＱＷＱ-３２Ｂ的２０倍。

流动版 | 完全版

论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南

版权所有不得转载 (C) 2025 Suntek Computer Systems Limited.

免责声明 : 88iv设立此一网站，旨在以最快捷的方式为公众人士提供清楚准确的最新资料，但在整理资料及编写程式时或会有无心之失。故88iv特此声明，此一网站所载的资料如有任何不确之处、遗漏或误植错字，并引致任何直接或间接的损失或亏损，88iv概不负责，亦不会作出任何赔偿（不论根据侵权法、合约或其他规定亦然）。此外，88iv并不保证本网站所载的资料乃属正确无误及完整无缺，亦不担保可以及时将资料上网及内容适合有关用途。