新闻热点

【两会聚焦】新通义千问比肩DeepSeek-R1 阿里巴巴劲升8% “人工智能+”发力掀国产大模型竞逐- 财经 - 香港文汇网 @ 2025-03-07T 返回 新闻热点
关键词:阿里 模型
概念:阿里巴巴股价 , 阿里开源推理模型通义千问
阿里通义千问QWQ-32B是一款拥有320亿参数的模型,在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能媲美DEEPSEEK-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低模型应用成本。
阿里(9988)旗下通义千问QWEN团队推出QWQ-32B大语言模型,据称其性能媲美拥有6,710亿参数的DEEPSEEK-R1(其中370亿被激活),更在某些测试中超越了对方。受消息影响,阿里股价今早曾升逾7%至139.6元;暂报138.2元,续升逾6%。
阿里云表示,这是“通义千问”在大规模强化学习(RL)以增强推理能力方面的第一步。在致力开发下一代“通义千问”的过程中,阿里云计划将更强大的基础模型与依托规模化计算资源的 RL 相结合,从而使其更接近实现人工通用智能(AGI)。此外,阿里云正积极探索将智能体与 RL 集成,以实现长时推理,目标是通过推理时间扩展来释放更高的智能。 (LF)
阿里巴巴发布了通义千问QWQ-32B模型,参数数量达到320,与DEEPSEEK R1相当,但后者参数数量为QWQ-32B的20倍。

 

易发投资 | 首页 |  登录
流动版 | 完全版
论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明
版权所有 不得转载 (C) 2025
Suntek Computer Systems Limited.