Anthropicは5月28日(現地時間)、同社の最高位AIモデル「Claude Mythos(クロード・ミュトス)Preview」クラスのAIモデルについて、より強力な安全策を講じた上で、数週間以内に全顧客に提供するとの見通しを明らかにした。
Mythos Previewの特徴と提供計画
Mythos Previewは4月に発表した同社最高性能のモデルで、ゼロデイ脆弱性の自律的な発見能力を持つ。悪用リスクの大きさから一般公開を見送り、「Project Glasswing」としてAppleやGoogle、Microsoftなど限られたパートナー企業にのみ、防御目的で提供していた。
日本では三菱UFJ銀行、三井住友銀行、みずほ銀行がアクセス権確保を目指しているほか、日本政府も交渉を進めていると報じられている。
最新モデル「Opus 4.8」の性能向上
同日発表した最新AIモデル「Claude Opus 4.8」は、前世代のOpus 4.7からコーディング、推論、エージェント能力などの各ベンチマークで性能を向上させたという。
「誠実さ」を改善したのが特長。自身が書いたコードの欠陥を見逃す可能性が、前世代の約4分の1に減少しているという。コンテクストを維持しながら自律的に長く独立して作業する能力も向上した。
安全性の向上と価格
ユーザーを欺いたり、有害な要求に応えるなど、Anthropicの安全基準や意図に反する「アライメント不良行動」の発生率はOpus 4.7よりも大幅に低く、最もアライメントが高い(Anthropicの意図通りに行動する)Claude Mythos Previewと同程度だという。
価格はOpus 4.7から据え置きで、100万入力トークンあたり5ドル、100万出力トークンあたり25ドル。
関連動向:Project Glasswingと金融機関の対応
Anthropicは5月22日(現地時間)、セキュリティプロジェクト「Project Glasswing」の初期報告を公開した。約50社のパートナー企業が1カ月で高・重大レベルの脆弱性を1万件超発見した成果に加え、同社が独自に進めてきたオープンソースソフトウェアのスキャン結果も公表された。
金融庁と日本銀行は5月22日、ChatGPTやClaudeなど「フロンティアAI」が脆弱性を短期間で大量発見できる脅威を受け、金融機関に9項目の短期的対応を要請した。



