2026年6月9日、Anthropicが新しいフロンティアモデル「Claude Fable 5」と「Claude Mythos 5」を同時発表しました。Fable 5は本日から全ユーザーが利用可能で、コーディング・科学研究・長期タスクで従来モデルを大きく上回る性能を発揮します。一方、Mythos 5は米国政府のサイバー防衛担当者など限られた組織にのみ提供される制限版です。
「同じ基盤モデルを2つに分割する」というAnthropicの新戦略は業界でも注目を集めています。この記事では、両モデルの違い、Opus 4.8からの性能向上、そして安全フィルターの仕組みを図解でわかりやすく解説します。
この記事のポイント
- Fable 5は今日から全員使える——Mythosクラスの能力を一般向けに安全化したモデル。価格はOpus 4.8と同額
- コーディング性能が突出——SWE-Bench Proでは80.3%(Opus 4.8は69.2%)。Stripeが2ヶ月の作業を1日で完了した事例も
- 2つのモデルは同じ基盤——安全フィルターの「ON/OFF」だけが違い。Fable 5はフィルターON、Mythos 5はサイバー分野のフィルターをOFF
- Mythos 5は一般公開なし——米政府のProject Glasswingパートナーと信頼された生命科学研究者のみがアクセス可能
まず全体像を把握しよう——「1つの基盤、2つの出口」
今回の発表で最も理解しておきたいのが、FableとMythosが「同一の基盤モデルから作られている」という点です。下の図でイメージを掴んでください。
Claude Fable 5 & Mythos 5 — 構造の全体像
コーディング・科学研究・長期タスクで最高性能
✅ Claude Fable 5
一般公開・全ユーザー利用可
- 安全フィルター ON
- サイバー・生物兵器系クエリはブロック
- フィルター発動時はOpus 4.8へフォールバック
- 発動率:セッションの5%未満
🔒 Claude Mythos 5
限定公開(承認制)
- サイバーセキュリティ制限を 解除
- 米政府Project Glasswingパートナー向け
- 信頼された生命科学研究者向け
- タンパク質設計などの研究に活用
※ 両モデルの価格は同額:入力 $10 / 出力 $50(100万トークンあたり)
この「分割戦略」はAnthropicの新しいアプローチです。以前はモデルを1つ作ったら全員同じものを使っていましたが、今回は能力の高いモデルを安全にデプロイするために、用途ごとに分岐させるという考え方を採用しました。
Opus 4.8と比べてどれだけ強くなったのか
数字で見ると、Fable 5の性能向上は特にコーディング分野で顕著です。ベンチマーク結果を視覚化してみましょう。
📊 ベンチマーク比較(2026年6月時点)
SWE-Bench Pro — 実際のGitHub issueをコードで解決する難易度の高いベンチマーク
FrontierCode — 特に困難なコーディングタスク(Cognition社評価)
ExploitBench — サイバーセキュリティ(Mythos 5での数値)
※ FrontierCodeのバーの長さはスコアの相対比較用に調整しています
特に注目なのがFrontierCodeでの差です。Fable 5の29.3%に対してOpus 4.8は13.4%と、2倍以上の開きがあります。「困難なコーディングタスク」ほど差が大きく開く傾向があり、複雑なソフトウェア開発やリファクタリングで真価を発揮するモデルといえます。
安全フィルターの仕組み——「もしブロックされたら?」
Fable 5には従来にはなかった「独立した安全分類器(AI)」が搭載されています。ユーザーの入力内容を常時監視し、危険なクエリを検出すると自動でOpus 4.8に切り替えます。
🛡️ Fable 5の安全フィルター ——処理の流れ
サイバー攻撃・生物兵器・モデル蒸留に関する内容かをチェック
通常通り最高性能で応答
より保守的なモデルが代わりに対応
ブロック対象となる3つの領域:
脆弱性発見・攻撃的タスク
マスウェポン関連クエリ
AIの能力を不正に抽出する試み
「Fable 5を使っていたら突然別のモデルに切り替わった」という体験が起きるのは、このフォールバックの仕組みによるものです。ただし通常の利用(コーディング・文章作成・分析など)では95%以上のセッションでフォールバックは発生しないとAnthropicは公表しています。
実際の活用事例——StripeのRubyコードベース移行
Anthropicが紹介した事例の中で特に注目されているのが、決済インフラ企業Stripeによるコードベース移行です。
📌 Stripeの事例
もちろん、AIが完全に無監督で作業を完了させるわけではなく、人間によるレビュープロセスも含まれています。それでも、「2ヶ月の作業計画を1日で終わらせる」スケールの自動化は、ソフトウェアエンジニアリングの現場に大きな変化をもたらす可能性があります。
Fable 5 vs Mythos 5——どこが違うのか整理
| 項目 | Claude Fable 5 | Claude Mythos 5 |
|---|---|---|
| 基盤モデル | 同一(Mythosクラス) | |
| 提供対象 | 全ユーザー(一般公開) | Project Glasswingパートナー、信頼された生命科学研究者のみ |
| サイバー攻撃系クエリ | ❌ ブロック(Opus 4.8にフォールバック) | ✅ 対応可能 |
| 生物・化学兵器系 | ❌ ブロック | ❌ ブロック(解除なし) |
| 主な用途 | コーディング・文章・分析・研究全般 | サイバー防衛シミュレーション、タンパク質設計などの生命科学研究 |
| 価格 | 入力 $10 / 出力 $50(100万トークンあたり) | |
| ExploitBench | 非公開(フィルター有) | 78%(世界最高水準) |
Opus 4.8との比較まとめ
| 観点 | Fable 5 | Opus 4.8 |
|---|---|---|
| SWE-Bench Pro | 80.3% | 69.2% |
| FrontierCode | 29.3% | 13.4% |
| 長期・自律タスク | より長く安定して継続 | 標準的 |
| サイバー系クエリ | フォールバック(Opus 4.8へ) | そのまま対応 |
| 価格 | 同額 | |
価格が同じで性能が上回る領域が多いため、通常用途ではFable 5への切り替えが合理的な選択となりそうです。ただし、セキュリティツール開発やペネトレーションテスト支援など、サイバー関連の専門業務ではOpus 4.8が引き続き有効な場面があります。
まとめ
Claude Fable 5は、Anthropicが「最も能力の高いモデルを安全に一般公開する」という課題に対して出した一つの回答です。同じ基盤をもつMythos 5は制限された組織にのみ提供し、それ以外のユーザーには安全フィルター付きの高性能版を届けるという分割戦略は、AI産業全体の安全と普及をどう両立させるかという問いへの実験的な試みともいえます。
コーディングや科学研究での性能はOpus 4.8を大きく上回っており、日常的な開発・分析・長期エージェントタスクでは今後Fable 5が標準的な選択肢になっていく可能性があります。詳細や最新情報はAnthropic公式発表をご確認ください。



コメント