人工智能公司Anthropic宣布,首次將其迄今能力最強的模型向一般用戶開放,同時引入更嚴格的安全防護機制,以降低先進AI技術遭濫用的風險。
Anthropic周一推出全新模型Claude Fable 5,這是Claude Mythos系列首次對外公開的版本。Mythos模型今年4月以預覽形式推出,由於具備強大的推理與執行能力,當時僅開放給少數合作夥伴使用。上周,Anthropic已將測試範圍擴大至超過15個國家、約150家跨產業組織。
根據Anthropic介紹,Claude Fable 5在軟體工程、知識工作及視覺理解等領域表現優異,但為避免技術遭不當利用,系統對網路安全、生物科技、化學及模型蒸餾(distillation)等高風險領域設置限制。當用戶提出相關問題時,系統將轉由安全限制較完整的Claude Opus 4.8回應,而非由Fable 5直接處理。
與此同時,Anthropic亦向原有合作夥伴推出升級版Claude Mythos 5,進一步提升高階企業客戶的使用能力。
Anthropic表示,大部分使用情境仍由Fable 5自行完成回應。根據初步測試數據,超過95%的使用階段完全由Fable 5處理,僅少數高風險案例會切換至其他模型。
漏洞懸賞
由於擔心先進模型可能遭駭客或犯罪組織利用,Anthropic在正式發布前進行大規模安全測試,包括模擬越獄(Jailbreak)攻擊及漏洞懸賞計畫。公司指出,內部測試累計超過1,000小時,未發現有效突破模型安全限制的方法;隨後與多家資安紅隊合作,也未能成功實現有效越獄攻擊。
不過,Anthropic坦言,未來仍可能出現未知的新型攻擊方式。因此,隨著Claude Fable 5及Claude Mythos 5上線,公司同步實施新的資料保留政策,將所有使用流量保留30天,即使先前簽署零資料留存協議的企業客戶亦適用。
Anthropic強調,相關資料不會用於模型訓練,而是作為安全監測用途,用以識別新型越獄手法及其他複雜攻擊,並降低誤判風險。市場分析認為,此舉可能成為生成式AI產業的重要先例,即高階模型在提供使用權限的同時,也必須保留一定程度的使用紀錄以維持安全性。
在商業化方面,Claude Fable 5已透過Claude API及按用量計費的Enterprise方案向所有用戶開放。即日起至6月22日,Pro、Max、Team及部分Enterprise訂閱用戶可免費使用該模型;6月23日起,Anthropic將改採點數計費模式。
價格方面,Claude Fable 5及Claude Mythos 5的收費標準均為每百萬個輸入Token收費10美元、每百萬個輸出Token收費50美元,約為Claude Opus 4.8的兩倍。儘管較高定價可能限制部分用戶採用意願,但Anthropic表示,對市場需求前景仍抱持樂觀態度。(編輯部)