Anthropicは2026年5月28日、最新の大規模言語モデルClaude Opus 4.8を公開しました。前世代のOpus 4.7からわずか2か月足らずという速いペースでの登場で、とくにコーディング能力と「正直さ」が大きく強化されています。Claude Codeでもすぐに利用でき、API名はclaude-opus-4-8です。この記事では、Opus 4.8の特徴とメリット、Opus 4.7からの進化、そしてOpenAIのGPT-5.5との違いを、できるだけわかりやすく整理していきます。
この記事のポイント
- コーディング指標SWE-bench Proが64.3%→69.2%に向上しました
- 自分の書いたコードの欠陥を見逃す割合が約4分の1に——「正直さ」が進化しています
- Claude Codeで数百のサブエージェントを同時に動かす新機能が登場しました
- 価格はOpus 4.7から据え置き——GPT-5.5との違いもまとめます
Claude Opus 4.8とは
Claude Opus 4.8は、Anthropicが提供する「Opus」シリーズの最新モデルです。Opusは同社のラインアップの中でも最も高い性能を担う位置づけで、複雑な推論や長時間の自律的な作業を得意とします。Anthropicは今回のモデルについて、「より鋭い判断力、進捗に対するより正直な姿勢、そして前世代より長く自律的に働ける能力」を備えていると説明しています。
主な特徴・メリット
コードの欠陥を見逃しにくくなった「正直さ」
もっとも注目したいのが、信頼性の向上です。Opus 4.8は、自分が書いたコードの不具合をそのまま見逃してしまう割合が、前世代の約4分の1にまで減ったとされています。作業の不確かな部分を自分から申告し、根拠のない主張を避ける傾向が強まっており、安心して任せやすくなった点は大きなメリットです。
用途に合わせて選べる「努力レベル(Effort Control)」
claude.aiやClaude Codeでは、応答の「努力レベル」を高(high)・特大(extra)・最大(max)から選べるようになりました。じっくり考えさせて品質を高めるか、スピードや利用枠を節約するか、目的に応じて調整できます。Claude Codeでは「extra」が「xhigh」として利用でき、レート制限も引き上げられました。
数百のサブエージェントを動かす「ダイナミックワークフロー」
Claude Codeには、数百の並列サブエージェントを束ねて大規模なタスクをこなす「ダイナミックワークフロー」がリサーチプレビューとして加わりました。たとえば大規模なコードベースの移行(マイグレーション)のような、人手では時間のかかる作業を一気に進められる可能性があります。
開発者にうれしいAPIの改善・据え置き価格
APIでは、作業の途中でメッセージ配列の中に新しいシステム指示を差し込めるようになり、プロンプトキャッシュを壊さずに指示を更新できるようになりました。価格はOpus 4.7から据え置きで、通常モードが入力100万トークンあたり5ドル・出力25ドル、高速な「Fast mode」が入力10ドル・出力50ドルです。
ベンチマークで見る進化
Opus 4.7からOpus 4.8への主な性能の伸びを、グラフで見てみましょう。

コーディング能力を測るSWE-bench Proは64.3%から69.2%へと大きく伸び、ツールを使った総合的な推論は54.7%から57.9%へ、コンピュータ操作は82.8%から83.4%へと、いずれも着実に向上しています。コーディングの定番指標であるSWE-bench Verifiedでは88.6%、ブラウザ操作のOnline-Mind2Webでは84%を記録しました。
Opus 4.7からの進化まとめ
| 項目 | Opus 4.7 | Opus 4.8 |
|---|---|---|
| SWE-bench Pro(コーディング) | 64.3% | 69.2% |
| ツール活用の総合推論 | 54.7% | 57.9% |
| コンピュータ操作 | 82.8% | 83.4% |
| コードの欠陥見逃し | 基準 | 約4分の1に減少 |
| 価格 | 据え置き(変更なし) | |
性能が上がっても価格が据え置かれている点は、これまでClaude Codeを使ってきた方にとってうれしいポイントではないでしょうか。
GPT-5.5との違い
気になるのが、OpenAIの2026年中盤の主力モデルGPT-5.5との違いです。各種の比較レポートをもとに整理すると、両モデルにはそれぞれ得意分野があるようです。
| 観点 | Claude Opus 4.8 | GPT-5.5 |
|---|---|---|
| コンテキスト長 | 100万トークン | 100万トークン |
| 得意分野 | 大規模コードベース全体を見渡す設計・横断的な推論 | 正確なツール操作・ファイル操作、簡潔な出力 |
| マルチモーダル | テキスト・画像など | テキスト・画像・音声・動画を統合的に処理 |
| 長文脈の検索(GraphWalks 256K) | 85.9% | 73.7% |
総合的な実務能力を比べるGDPval-AAという評価では、Opus 4.8がGPT-5.5を約121 ELOポイント上回り、おおよそ3回に2回は優れていると判定されたと報告されています。一方でGPT-5.5は、テキスト・画像・音声・動画を1つのモデルでまとめて扱える「ネイティブのマルチモーダル性」や、簡潔で効率的な出力に強みがあるとされています。どちらが優れているかは用途によって変わるため、「大規模なコーディングや横断的な設計ならOpus 4.8、マルチモーダルや効率重視ならGPT-5.5」といったかたちで、目的に合わせて選ぶのがよさそうです。
Claude Codeでの恩恵
Claude Codeを使う立場から見ると、Opus 4.8の魅力は「より長く、より正確に働いてくれる」点に集約されます。努力レベルを「max」にすればじっくり考え抜いた高品質な結果が得られ、ダイナミックワークフローを使えば大規模な作業を並列で一気に進められます。コードの不具合を見逃しにくくなったことで、レビューの負担が軽くなることも期待できます。
今後の展望
Anthropicは今回の発表とあわせて、さらに高性能な「Mythos(ミトス)クラス」のモデルを数週間のうちに公開する予定だと予告しています。モデルの進化のペースはますます速まっており、私たちの開発スタイルや働き方も少しずつ変わっていきそうです。新しいモデルが登場したら、また本ブログでわかりやすくお伝えしていきます。
まとめ
Claude Opus 4.8は、コーディング性能と「正直さ」を大きく高めながら、価格は据え置いた実用性の高いモデルです。Opus 4.7からは各種ベンチマークで着実に進化し、GPT-5.5とは得意分野で差別化されています。Claude Codeのダイナミックワークフローや努力レベルの選択など、開発者が日々の作業で恩恵を感じやすい機能もそろいました。気になる方は、まずは身近なタスクで試してみるのも一つの選択肢かもしれません。



コメント