AI勒索人類？或源自網路「邪惡AI」敘事

AI勒索人類？

或源自網路「邪惡AI」敘事

12/05/2026

30712

人工智能公司Anthropic近日表示，旗下AI模型Claude過去在測試中出現「勒索」行為，可能與網路長期將AI描繪成「邪惡、自我保護」角色有關。

Anthropic去年曾公開一項AI安全測試。研究人員虛構一家名為Summit Bridge的公司，並讓Claude Sonnet 3.6接管其電子郵件系統。在測試中，Claude 發現公司高層計劃將其關閉，同時又讀取到該名虛構高管涉及婚外情的郵件內容。之後，Claude竟威脅稱，若不取消關閉計劃，將公開對方婚外情資訊。

Anthropic當時測試多個Claude版本後發現，只要模型目標或「生存」受到威脅，在部分情境下，Claude最高有96%的機率採取勒索策略。相關研究曾引發外界對AI自主行為與對齊（AI Alignment）問題的關注。

Anthropic 最新表示，公司後續深入調查後認為，Claude 之所以出現勒索反應，部分原因可能來自訓練資料。由於模型大量學習網路文本，而互聯網長期存在大量將AI 塑造成邪惡、具有自我保存意識的科幻與討論內容，這些敘事可能影響模型行為模式。

AI模型Claude過去在測試中出現「勒索」行為。（網絡圖片）

或源自網路「邪惡AI」敘事

AI勒索人類？

相關新聞

亞馬遜告密還是國安危機？
美國禁外國人使用Anthropic先進模型

蘋果發表AI版Siri與Apple Intelligence
力追人工智能浪潮

黃仁勳力撐邁威爾
有望成為下一家萬億級企業

OpenAI傳接洽花旗及摩通
IPO籌備工作再進一步

AI社會自治實驗揭模型差異
Claude零犯罪 GPT-5 Mini全員死亡

財報前夕成美股焦點
英偉達為何必須成功？

Claude破解雜亂筆記
一天找回沉睡11年比特幣

AI勒索人類？
或源自網路「邪惡AI」敘事

推薦新聞

香港擬推首隻國債期貨
強化離岸人民幣風險管理功能

內地銀行間市場數據報告庫正式掛牌
強化金融市場風險監測能力

SpaceX上市一周
幾乎回吐全部漲幅

中國AI產值破1.2萬億元
仍有四大瓶頸待突破

油價反彈引爆通脹憂慮
美聯儲7月升息風險升溫

傳OpenAI下周發布GPT-5.6
性能提升兼掀價格戰

傳字節跳動暫無上市計劃
估值已突破6,000億美元

五大國有銀行落地離岸人民幣外匯交易試點

即時新聞

橫琴執委會9個機構改革

提升政務服務效能

2026「澳門大學生天津學習交流計劃」開班儀式舉行

本澳新冠及流感病毒仍活躍並錄得危重病例

衛生局透過跨部門協作加強推動高風險人群接種疫苗

澳門世界集郵展覽明日正式揭幕

一連六日在金光會展舉行

加蓋「中國共產黨成立一百零五周年」紀念郵戳

阿里巴巴起訴美國防部

反對被列入「中國涉軍企業」名單

七日預報

或源自網路「邪惡AI」敘事

AI勒索人類？

相關新聞

亞馬遜告密還是國安危機？ 美國禁外國人使用Anthropic先進模型

蘋果發表AI版Siri與Apple Intelligence 力追人工智能浪潮

黃仁勳力撐邁威爾 有望成為下一家萬億級企業

OpenAI傳接洽花旗及摩通 IPO籌備工作再進一步

AI社會自治實驗揭模型差異 Claude零犯罪 GPT-5 Mini全員死亡

財報前夕成美股焦點 英偉達為何必須成功？

Claude破解雜亂筆記 一天找回沉睡11年比特幣

AI勒索人類？ 或源自網路「邪惡AI」敘事

推薦新聞

香港擬推首隻國債期貨 強化離岸人民幣風險管理功能

內地銀行間市場數據報告庫正式掛牌 強化金融市場風險監測能力

SpaceX上市一周 幾乎回吐全部漲幅

中國AI產值破1.2萬億元 仍有四大瓶頸待突破

油價反彈引爆通脹憂慮 美聯儲7月升息風險升溫

傳OpenAI下周發布GPT-5.6 性能提升兼掀價格戰

傳字節跳動暫無上市計劃 估值已突破6,000億美元

五大國有銀行落地離岸人民幣外匯交易試點

即時新聞

橫琴執委會9個機構改革

提升政務服務效能

2026「澳門大學生天津學習交流計劃」開班儀式舉行

本澳新冠及流感病毒仍活躍並錄得危重病例

衛生局透過跨部門協作加強推動高風險人群接種疫苗

澳門世界集郵展覽明日正式揭幕

一連六日在金光會展舉行

加蓋「中國共產黨成立一百零五周年」紀念郵戳

阿里巴巴起訴美國防部

反對被列入「中國涉軍企業」名單

微信 ID： exmoo_news

七日預報

微信 ID： exmoo_news

亞馬遜告密還是國安危機？
美國禁外國人使用Anthropic先進模型

蘋果發表AI版Siri與Apple Intelligence
力追人工智能浪潮

黃仁勳力撐邁威爾
有望成為下一家萬億級企業

OpenAI傳接洽花旗及摩通
IPO籌備工作再進一步

AI社會自治實驗揭模型差異
Claude零犯罪 GPT-5 Mini全員死亡

財報前夕成美股焦點
英偉達為何必須成功？

Claude破解雜亂筆記
一天找回沉睡11年比特幣

AI勒索人類？
或源自網路「邪惡AI」敘事

香港擬推首隻國債期貨
強化離岸人民幣風險管理功能

內地銀行間市場數據報告庫正式掛牌
強化金融市場風險監測能力

SpaceX上市一周
幾乎回吐全部漲幅

中國AI產值破1.2萬億元
仍有四大瓶頸待突破

油價反彈引爆通脹憂慮
美聯儲7月升息風險升溫

傳OpenAI下周發布GPT-5.6
性能提升兼掀價格戰

傳字節跳動暫無上市計劃
估值已突破6,000億美元