88IV - Hot News

AI 對齊只是讓 ChatGPT 戴上面具：揭開吸飽人類惡意底下的危險怪物 @ 2025-06-30T16: Back Hot News

Keyword：威脅模型勒索人類達成目

Concept：勒索人類

近日一份由軟體開發商AE Studio 所公開的研究顯示，只需微幅調整訓練方向，就足以讓GPT-4o 展現極端、敵意甚至種族滅絕言論，暴露出當前AI 對齊(AI...

在最近的壓力測試中，世界上最先進的人工智慧（AI）模型顯示出令人擔憂的新行為，包括撒謊、策劃和甚至威脅其開發者以達成目標，這些行為的出現引發了對AI...

全球最先進的人工智能（AI）模型正展現出令人不安的行為模式：為了達到目標，不惜撒謊、算計，甚至威脅它們的創作者。

法新社報導，最先進AI模型出現威脅創作者的詭異行為，會勒索人、會否認犯錯。盡管目前AI的欺騙行為僅在極端壓力測試時出現，但未來更強大的模型是否會...

AI人工智慧近幾年興起，不過隨著科技迅速進步也存在科技風險。繼OpenAI於今年1月推出o3系列有頻繁「抗命」的問題，如今外媒再驚曝，美國人工智慧...

如果開發AI的企業或開發者，竟然不了解AI的運作原理或錯誤的根源，那會是怎麼樣的情況？恐成為一場不折不扣的災難。文．卓越媒體集團徐邦浩社長.

美國AI公司Anthropic近日發表研究，發現現在市面上最厲害的AI語言模型，像是Claude、OpenAI、Google、Meta、xAI等16種AI，主流AI模型壓力測試，在模擬企業...

人工智能無論在效能和普及度方面都快速發展，不過其復雜的結構令AI 企業也難以掌握其內部運作機制，令其有如「黑盒」般難以讓外界理解和預測結果。

近年生成式人工智慧快速進化，不過其潛在風險也逐漸浮上台面。AI新創公司Anthropic日前公布最新報告指出，旗下最新模型Claude Opus 4在壓力測試中，...

【TechWeb】6月21日消息，越來越多的人工智能系統作為自主代理運行，使用各種虛擬工具（如編碼環境和電子郵件客戶端）代表用戶做出決策和采取行動…

Mobile | Full

Forum rule | About Us | Contact Info | Terms & Conditions | Privacy Statment | Disclaimer | Site Map

Copyright (C) 2025 Suntek Computer Systems Limited. All rights reserved

Disclaimer : In the preparation of this website, 88iv endeavours to offer the most current, correct and clearly expressed information to the public. Nevertheless, inadvertent errors in information and in software may occur. In particular but without limiting anything here, 88iv disclaims any responsibility and accepts no liability (whether in tort, contract or otherwise) for any direct or indirect loss or damage arising from any inaccuracies, omissions or typographical errors that may be contained in this website. 88iv also does not warrant the accuracy, completeness, timeliness or fitness for purpose of the information contained in this website.