Anthropic開放最強AI模型設安全閘門防範濫用風險

Anthropic開放最強AI模型

設安全閘門防範濫用風險

11/06/2026

19760

人工智能公司Anthropic宣布，首次將其迄今能力最強的模型向一般用戶開放，同時引入更嚴格的安全防護機制，以降低先進AI技術遭濫用的風險。

Anthropic周一推出全新模型Claude Fable 5，這是Claude Mythos系列首次對外公開的版本。Mythos模型今年4月以預覽形式推出，由於具備強大的推理與執行能力，當時僅開放給少數合作夥伴使用。上周，Anthropic已將測試範圍擴大至超過15個國家、約150家跨產業組織。

根據Anthropic介紹，Claude Fable 5在軟體工程、知識工作及視覺理解等領域表現優異，但為避免技術遭不當利用，系統對網路安全、生物科技、化學及模型蒸餾（distillation）等高風險領域設置限制。當用戶提出相關問題時，系統將轉由安全限制較完整的Claude Opus 4.8回應，而非由Fable 5直接處理。

與此同時，Anthropic亦向原有合作夥伴推出升級版Claude Mythos 5，進一步提升高階企業客戶的使用能力。

Anthropic表示，大部分使用情境仍由Fable 5自行完成回應。根據初步測試數據，超過95%的使用階段完全由Fable 5處理，僅少數高風險案例會切換至其他模型。

漏洞懸賞

由於擔心先進模型可能遭駭客或犯罪組織利用，Anthropic在正式發布前進行大規模安全測試，包括模擬越獄（Jailbreak）攻擊及漏洞懸賞計畫。公司指出，內部測試累計超過1,000小時，未發現有效突破模型安全限制的方法；隨後與多家資安紅隊合作，也未能成功實現有效越獄攻擊。

不過，Anthropic坦言，未來仍可能出現未知的新型攻擊方式。因此，隨著Claude Fable 5及Claude Mythos 5上線，公司同步實施新的資料保留政策，將所有使用流量保留30天，即使先前簽署零資料留存協議的企業客戶亦適用。

Anthropic強調，相關資料不會用於模型訓練，而是作為安全監測用途，用以識別新型越獄手法及其他複雜攻擊，並降低誤判風險。市場分析認為，此舉可能成為生成式AI產業的重要先例，即高階模型在提供使用權限的同時，也必須保留一定程度的使用紀錄以維持安全性。

在商業化方面，Claude Fable 5已透過Claude API及按用量計費的Enterprise方案向所有用戶開放。即日起至6月22日，Pro、Max、Team及部分Enterprise訂閱用戶可免費使用該模型；6月23日起，Anthropic將改採點數計費模式。

價格方面，Claude Fable 5及Claude Mythos 5的收費標準均為每百萬個輸入Token收費10美元、每百萬個輸出Token收費50美元，約為Claude Opus 4.8的兩倍。儘管較高定價可能限制部分用戶採用意願，但Anthropic表示，對市場需求前景仍抱持樂觀態度。（編輯部）

設安全閘門防範濫用風險