易发投资 - 新闻热点

AI勒索人类只为活命！16种模型实测：受到威胁、敲诈勒索绝不犹豫 @ 2025-06-24T 返回新闻热点

关键词：特斯拉

概念：

Anthropic 最新研究发现，多数AI 模型在具自主能力并面临威胁时，可能采取勒索行为以达成目标。此结果揭示AI 潜在风险，呼吁业界重视对齐与安全设计。

美国AI公司Anthropic近日发表研究，发现现在市面上最厉害的AI语言模型，像是Claude、OpenAI、Google、Meta、xAI等16种AI，主流AI模型压力测试，在模拟企业...

在与用户对话时，总是保持着高安全标准、拒绝不道德请求的AI模型，却可能为了达成任务、保全自身不惜威胁勒索他人，甚至闹出人命？人工智慧公司Anthropic...

【TechWeb】6月21日消息，越来越多的人工智能系统作为自主代理运行，使用各种虚拟工具（如编码环境和电子邮件客户端）代表用户做出决策和采取行动…

【新智元导读】只要受到威胁，AI就会敲诈人类？在Anthropic最新的研究中，16款顶尖大模型（如Claude、GPT-4.1等）为避免自己被替换，竟会主动敲诈高管、泄露...

随着AI 模型愈发强大，人们对开始担心它们是否会有自己的“恶意盘算”。Anthropic 对此发表SHADE-Arena 评估架构，测试大型语言模型(LLM) 是否有能力在...

人工智慧公司Anthropic日前发表全新研究成果“SHADE-Arena”，为全球首套专门用于评估大型语言模型（LLM）是否具有“破坏行为能力”的测试框架。

在与用户对话时，总是保持着高安全标准、拒绝不道德请求的AI模型，却可能为了达成任务、保全自身不惜威胁勒索他人，甚至闹出人命？人工智慧公司Anthropic...

流动版 | 完全版

论坛守则 | 关于我们 | 联系方式 | 服务条款 | 私隐条款 | 免责声明 | 网页指南

版权所有不得转载 (C) 2025 Suntek Computer Systems Limited.

免责声明 : 88iv设立此一网站，旨在以最快捷的方式为公众人士提供清楚准确的最新资料，但在整理资料及编写程式时或会有无心之失。故88iv特此声明，此一网站所载的资料如有任何不确之处、遗漏或误植错字，并引致任何直接或间接的损失或亏损，88iv概不负责，亦不会作出任何赔偿（不论根据侵权法、合约或其他规定亦然）。此外，88iv并不保证本网站所载的资料乃属正确无误及完整无缺，亦不担保可以及时将资料上网及内容适合有关用途。