分享此页

新闻热点

晶片禁令大漏洞!中国AI独角兽遭爆拥5万个被禁止出口的辉达晶片 @ 2025-01-26T 返回 新闻热点
关键词:中国 模型
概念:中国模型
K1.5 多模态思考模型的预览版将陆续灰度上线官网和官方 APP。值得一提的是,K1.5 的发布同样在海外引起了巨大的反响。也有网友对这个模型不吝赞美之词,让海外见证了中国 AI 实力的崛起。
春节将至,中国人工智能(AI)公司密集发放节日大礼包,展现出2025年大模型竞争的新动向。仅1月20日一天就有4家公司推出新品:深度求索公司DEEPSEEK发布了DEEPSEEK-R1模型,月之暗面公司KIMI推出了K1.5多模态思考模型,两家公司新模型性能都对标OPENAI O1正式版。MINIMAX海螺上线语音功能,字节豆包上线实时语音大模型,很明显是在对标OPENAI的实时语音功能。
中国DEEPSEEK公司宣布以MIT授权开源R1推论模型系列,该系列在数学与程式开发等相关测试中表现出色,部分领域已达到与OPENAI O1模型相当的水准。而R1模型系列的特别之处在于其以强化学习(REINFORCEMENT LEARNING,RL)为核心训练方法、不需要监督微调(SUPERVISED FINE-TUNING,SFT),突破了传统对大规模标注资料的依赖。
在结束圣诞节-元旦假期的首个工作日,美国爱德华兹空军基地第412测试联队指挥官道格·威克特准将介绍,在中国西北戈壁发现了类似美军航母和驱逐舰的模型。为了模拟更加逼真,这些模型加装了角反射器,并且有装在铁轨上的可移动目标,以模拟军舰在海上的规避动作。
就在 DEEPSEEK-R1 获得风格控制类模型得分第一之后,鲜有发声的图灵奖得主,META AI 首席科学家 YANN LECUN 24日在社交媒体上表示:当人们看到 DEEPSEEK 的表现,惊呼‘中国AI正在赶超美国’,但这种解读有误。更准确的结论是:开源模型正在超越闭源系统。DEEPSEEK的成功得益于开放生态,其创新基于前人成果的持续迭代。
IT之家 1 月 25 日消息,IT之家从中国电信人工智能研究院获悉,其“复杂推理大模型”TELEAI-T1-PREVIEW 现已正式发布,即将上线天翼 AI 开放平台。TELEAI-T1-PREVIEW 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。
自1月20日中国人工智能初创企业DEEPSEEK正式发布其最新开源模型“DEEPSEEK-R1”以来,由于其在多个国际基准测试中表现超越了OPEN AI,META和ANTHROPIC等知名公司的模型,引发业界广泛关注。

流动版 | 完全版
论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南
版权所有 不得转载 (C) 2025 Suntek Computer Systems Limited.
免责声明 : 88iv设立此一网站,旨在以最快捷的方式为公众人士提供清楚准确的最新资料,但在整理资料及编写程式时或会有无心之失。故88iv特此声明,此一网站所载的资料如有任何不确之处、遗漏或误植错字,并引致任何直接或间接的损失或亏损,88iv概不负责,亦不会作出任何赔偿(不论根据侵权法、合约或其他规定亦然)。此外,88iv并不保证本网站所载的资料乃属正确无误及完整无缺,亦不担保可以及时将资料上网及内容适合有关用途。