易發投資 - 熱門新聞

分享此頁

AI 對齊只是讓 ChatGPT 戴上面具：揭開吸飽人類惡意底下的危險怪物 @ 2025-06-30T16: 返回熱門新聞

關鍵詞：威脅模型勒索人類達成目

概念：勒索人類

近日一份由軟體開發商AE Studio 所公開的研究顯示，只需微幅調整訓練方向，就足以讓GPT-4o 展現極端、敵意甚至種族滅絕言論，暴露出當前AI 對齊(AI...

在最近的壓力測試中，世界上最先進的人工智慧（AI）模型顯示出令人擔憂的新行為，包括撒謊、策劃和甚至威脅其開發者以達成目標，這些行為的出現引發了對AI...

全球最先進的人工智能（AI）模型正展現出令人不安的行為模式：為了達到目標，不惜撒謊、算計，甚至威脅它們的創作者。

法新社報導，最先進AI模型出現威脅創作者的詭異行為，會勒索人、會否認犯錯。盡管目前AI的欺騙行為僅在極端壓力測試時出現，但未來更強大的模型是否會...

AI人工智慧近幾年興起，不過隨著科技迅速進步也存在科技風險。繼OpenAI於今年1月推出o3系列有頻繁「抗命」的問題，如今外媒再驚曝，美國人工智慧...

如果開發AI的企業或開發者，竟然不了解AI的運作原理或錯誤的根源，那會是怎麼樣的情況？恐成為一場不折不扣的災難。文．卓越媒體集團徐邦浩社長.

美國AI公司Anthropic近日發表研究，發現現在市面上最厲害的AI語言模型，像是Claude、OpenAI、Google、Meta、xAI等16種AI，主流AI模型壓力測試，在模擬企業...

人工智能無論在效能和普及度方面都快速發展，不過其復雜的結構令AI 企業也難以掌握其內部運作機制，令其有如「黑盒」般難以讓外界理解和預測結果。

近年生成式人工智慧快速進化，不過其潛在風險也逐漸浮上台面。AI新創公司Anthropic日前公布最新報告指出，旗下最新模型Claude Opus 4在壓力測試中，...

【TechWeb】6月21日消息，越來越多的人工智能系統作為自主代理運行，使用各種虛擬工具（如編碼環境和電子郵件客戶端）代表用戶做出決策和采取行動…