Claudeモデル比較2026 — Fable 5 / Opus / Sonnet / Haikuの使い分け
ClaudeにはFable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5の4系統があります。スペック・料金・思考の仕組み・コスト最適化まで、Mythosクラス登場後の最新構成で用途別の使い分けを比較します。
ClaudeにはFable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5の4系統のモデルがあります。スペック・料金・推論深度・速度・主用途・思考の仕組み・コスト最適化を軸に、どのタスクにどのモデルを選ぶかを比較します。
4系統の位置付け — Mythosクラスが加わった2026年6月以降の構成
Claudeモデルは「知能の深さ」「速度」「コスト」のトレードオフが異なる系統で提供されています。長らくOpus / Sonnet / Haikuの3系統でしたが、2026年6月9日にOpusクラスの一段上にあたるMythosクラスの一般提供版Claude Fable 5が加わり、選択肢は4系統になりました。ここでは2026年6月時点の最新版(Fable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5)を比較します。
| モデル | 強み | 主用途 | 推論深度 | 速度 |
|---|---|---|---|---|
| Claude Fable 5 | 強みフロンティア能力、長く複雑なタスクほど差が出る | 主用途長時間の自律タスク / 大規模コードベース横断 / 曖昧な根本原因調査 | 推論深度最高 | 速度中程度 |
| Claude Opus 4.8 | 強み最高水準の推論、adaptive thinking + effort制御 | 主用途重い思考 / 戦略立案 / コードレビュー / 研究 | 推論深度高 | 速度中程度 |
| Claude Sonnet 4.6 | 強み速度と品質のバランス、汎用最強 | 主用途標準的な執筆 / 調査 / 製品統合 / コーディング | 推論深度高 | 速度高 |
| Claude Haiku 4.5 | 強み高速 + 安価、構造的タスクで精度を保つ | 主用途抽出 / 採点 / 速報処理 / 軽量バッチ | 推論深度中 | 速度最高 |
「最初に試すならSonnet」「重い思考はOpus」「コスト最適化はHaiku」という従来の原則に、「長く曖昧な自律タスクはFable 5」が加わった形です。なおMythosクラスには安全装置を一部外したClaude Mythos 5もありますが、Project Glasswing経由の限定提供のため、一般に選べるのはFable 5です。Fable 5固有の仕様(安全装置とOpus 4.8への自動フォールバック、30日データ保持、サブスクでの提供条件など)はClaude Fable 5の解説で詳しく扱っているため、本記事では他系統との比較に絞ります。
スペック比較表
各モデルの公式スペック(2026年6月時点)を以下にまとめます。最新値はAnthropic公式model overviewとpricingで確認してください。
| 項目 | Fable 5 | Opus 4.8 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|---|
| コンテキスト長(入力) | Fable 51,000,000 tokens | Opus 4.81,000,000 tokens | Sonnet 4.61,000,000 tokens | Haiku 4.5200,000 tokens |
| 出力上限 | Fable 5128,000 tokens | Opus 4.8128,000 tokens | Sonnet 4.664,000 tokens | Haiku 4.564,000 tokens |
| Adaptive thinking(effortで制御) | Fable 5✓(常時オン・オフ不可) | Opus 4.8✓(low〜xhigh) | Sonnet 4.6✓ | Haiku 4.5✗ |
| Extended Thinking(budget_tokens) | Fable 5✗ | Opus 4.8✗ | Sonnet 4.6✓ | Haiku 4.5✓ |
| Vision(画像理解) | Fable 5✓ | Opus 4.8✓ | Sonnet 4.6✓ | Haiku 4.5✓ |
| Prompt caching | Fable 5✓ | Opus 4.8✓ | Sonnet 4.6✓ | Haiku 4.5✓ |
| Batch API | Fable 5✓ | Opus 4.8✓ | Sonnet 4.6✓ | Haiku 4.5✓ |
「思考の仕組み」と「出力上限」が最も大きな差別ポイントです。Fable 5とOpus 4.8はadaptive thinkingに一本化されており、effortパラメータで推論深度を調整します(Fable 5はthinkingを無効化できない点が特徴です)。Sonnet 4.6はadaptive thinkingとExtended Thinkingの両方に対応し汎用バランスが強み、Haiku 4.5はExtended Thinkingに対応しつつ速度と単価で優位です。なおFable 5はOpus 4.7世代のtokenizerを使うため、同じテキストでも旧世代モデルよりトークン数がおよそ30%多くカウントされる点はコスト見積もりで考慮が必要です。
料金比較(参考、2026年6月時点)
料金は時期と契約形態で変動します。本記事は構造を伝える目的で、執筆時点の参考値を示します。正確な値は公式pricingを参照してください。
| モデル | input(per 1M tokens) | output(per 1M tokens) | cache write | cache read(90% off) |
|---|---|---|---|---|
| Fable 5 | input(per 1M tokens)$10 | output(per 1M tokens)$50 | cache write$12.50 | cache read(90% off)$1 |
| Opus 4.8 | input(per 1M tokens)$5 | output(per 1M tokens)$25 | cache write$6.25 | cache read(90% off)$0.50 |
| Sonnet 4.6 | input(per 1M tokens)$3 | output(per 1M tokens)$15 | cache write$3.75 | cache read(90% off)$0.30 |
| Haiku 4.5 | input(per 1M tokens)$1 | output(per 1M tokens)$5 | cache write$1.25 | cache read(90% off)$0.10 |
Fable 5の単価はOpus 4.8のちょうど2倍、Opusの入力単価はSonnetの約1.7倍、HaikuはSonnetのおよそ1/3です。同じ作業量でも単価が高いぶん、Fable 5とOpusは判断の質が効く場面に絞って使うとコスト効率が上がります。
Batch APIを使うと全モデルで50% 割引、Prompt cachingを使うとcache読込部分がinputの0.1x(90% 割引)になり、累計コストを大きく下げられます。料金の内訳はAnthropic API完全ガイド2026で詳しく扱っています。
用途別使い分け早見表
実運用で「このタスクにはどのモデルを選ぶべきか」の判断を素早く下せるよう、よくある業務と推奨モデルの対応をまとめます。
| 業務 | 推奨モデル | 理由 |
|---|---|---|
| 長時間の自律エージェントタスク | 推奨モデルFable 5 | 理由タスクが長く複雑なほど他モデルとの差が広がる |
| 大規模コードベース横断の調査 / 移行 | 推奨モデルFable 5 | 理由1Mコンテキスト + 128K出力で分割せずに扱える |
| 戦略立案 / 編集視点付きの記事執筆 | 推奨モデルOpus 4.8 | 理由深い推論と独自視点が必要 |
| コードレビュー(差分の品質チェック) | 推奨モデルOpus 4.8 | 理由多観点の同時評価 + 提案の質 |
| アーキテクチャ設計 / 設計レビュー | 推奨モデルOpus 4.8 | 理由制約の同時考慮と判断 |
| 標準的な実装作業 | 推奨モデルSonnet 4.6 | 理由速度と品質のバランス |
| 一般的な調査 / WebFetch + 要約 | 推奨モデルSonnet 4.6 | 理由適切な情報統合 |
| 製品統合(LLM応答 → ユーザー) | 推奨モデルSonnet 4.6 | 理由ユーザー体験のレイテンシと品質 |
| 抽出系(構造化JSON出力) | 推奨モデルHaiku 4.5 | 理由速度 + 単価、精度も十分 |
| 大量バッチ採点(明確な判定基準) | 推奨モデルHaiku 4.5 | 理由累計コストが効く |
| ログ要約 / 単純分類 | 推奨モデルHaiku 4.5 | 理由パターン処理の典型 |
| リアルタイムチャット応答 | 推奨モデルHaiku 4.5 | 理由体感速度が決定的 |
| RAGでの検索結果合成 | 推奨モデルSonnet 4.6 + Prompt caching | 理由キャッシュとセットで最適化 |
| 多段推論を伴う研究タスク | 推奨モデルOpus 4.8(effort=xhigh) | 理由effortを上げて推論深度を引き上げ |
選び方の原則:
- デフォルトはSonnet:ほとんどのユースケースはSonnetで十分。コスト感も実用範囲
- 判断軸が複雑 / 独自性が必要 → Opus:採点 / レビュー / 戦略立案で品質を取りに行く
- 明確な判定基準 / 抽出系 → Haiku:既知パターンの分類、JSON抽出、ログ要約
- 長く曖昧な自律タスク → Fable 5:時間のかかる調査・移行・実装を丸ごと任せる場面で単価2倍を回収しやすい。攻撃的セキュリティや生物研究など安全装置のフォールバックが頻発するドメイン、ZDR(ゼロデータ保持)必須の組織はOpus 4.8が無難
すべてをFable 5に寄せるより、「従来構成で時間がかかっている・途中で迷走しがちなタスク」だけFable 5へ振り替えて完了率と所要時間を比べる併用構成が、コスト管理の面でも入りやすいところです。
思考深度の制御 — effortと2種類のthinking
応答前に内部で「思考」フェーズを挟む仕組みには、現在2つの方式があります。両者は対応モデルが異なるため、コードを書く前に使い分けを押さえておくと安全です。
- Adaptive thinking(effortで制御):Fable 5・Opus 4.8・Sonnet 4.6が対応します。Opus 4.8では
effortパラメータ(low / medium / high / xhigh / max)で思考の深さを指定し、既定はhighです。難問にはxhighを指定して推論深度を引き上げます。Fable 5はadaptive thinkingが常時オンで、{"type": "disabled"}によるthinkingの無効化が非サポートという点だけ他モデルと異なります。 - Extended Thinking(budget_tokensで制御):Sonnet 4.6とHaiku 4.5が対応します。
thinking: {"type": "enabled", "budget_tokens": 32000}のように思考トークンの予算を渡す方式です。
注意点として、Fable 5とOpus 4.8ではbudget_tokens方式のExtended Thinkingは使えません(Opus 4.7以降でこの指定は400エラーになります)。思考深度を上げたいときはeffortを上げる、というのが現行の正しい方法です。
深い思考が効くのは次のような用途です。
- 多段推論が必要な問題(数学 / コーディング / 戦略立案)
- 独自視点の生成(レビュー / 採点 / 編集解釈)
- 多変数の最適化(複数制約を満たす設計案の比較)
逆に深い思考が無駄になりやすいのは、「単純な抽出 / 分類 / フォーマット変換」のような決まったパターン処理です。これらはHaiku / Sonnetの通常応答で十分です。
xhighはOpusのeffortレベルの一つで、より深い推論を許可して難問への対応力を引き上げます。仕組みの詳細はOpusのxhighモードの深掘りを参照してください。
コスト最適化の3軸
実運用でコストを大きく下げる手法を3つ紹介します。
1. モデルルーティング
タスク別にOpus / Sonnet / Haikuを振り分けます。本サイト(Claude Media)の例:
- 記事生成のドラフト(
draft-writer): Sonnet - 4観点採点(
quality-judge): Opus(精度が決定的) - 単純抽出(
competitive-analyzerのURL一覧抽出): Haiku - 個人情報検出 / 字数カウント: Haiku(機械検証で十分)
これだけで累計コストがOpus一律と比べて60〜80% 削減できます。
2. Prompt caching
システムプロンプト・ツール定義・RAGコンテキストの静的部分を cache_control: {"type": "ephemeral"} でキャッシュ化します。後続リクエストで90% 割引(cache read = inputの0.1x)。
典型的な効果:
- システムプロンプト10,000 tokensを100リクエスト再利用 → cacheなし $30 / cacheあり $3
- 長いRAGコンテキスト(50,000 tokens)を50リクエストで再利用 → 大幅な節約
詳細はAnthropic API Prompt caching完全活用を参照してください。
3. Batch API
即時性が不要なバルク処理(数千〜数万件)はBatch APIで50% 割引。24時間以内に結果が返ります。
主用途:
- 月次レポート / 大量翻訳 / データセット作成
- リアルタイムでなくてよいRAGインデックス再生成
- 大量記事生成 / 採点
この3つを組み合わせると、累計コストは「Opus一律で全部API直叩き」比で1/10〜1/20に圧縮できます。
モデルIDと切り替え
Anthropic APIでモデルを指定するときのIDは次のとおりです(2026年6月時点)。
| モデル | API ID |
|---|---|
| Claude Fable 5 | API IDclaude-fable-5 |
| Claude Opus 4.8 | API IDclaude-opus-4-8 |
| Claude Sonnet 4.6 | API IDclaude-sonnet-4-6 |
| Claude Haiku 4.5 | API IDclaude-haiku-4-5-20251001 |
4.6世代以降のIDは日付サフィックスを持ちませんが、いずれも挙動が固定されたスナップショットで、中身が入れ替わるエイリアスではありません。4.6世代より前のモデルには日付付きIDを指す短縮エイリアス(claude-haiku-4-5 → claude-haiku-4-5-20251001 等)もありますが、本番運用では明示的なID指定が安全です。エイリアスの解決先が新版に切り替わると、未検証の挙動変化が混入する可能性があるためです。
Claude Codeセッション中は /model コマンドで切替できます(Fable 5はv2.1.170以降で表示されます)。settings.json の model キーでデフォルトを指定する方法と併用します。
よくある質問
Q1. Fable 5はどんなときに選ぶ?
長時間の自律タスク、大規模コードベースを横断する調査・移行、曖昧で大きな問題を丸ごと任せる場面が候補です。タスクが長く複雑になるほど他モデルとの差が広がるとされる一方、単価はOpus 4.8の2倍なので、定型処理では差を回収しにくくなります。安全装置によるOpus 4.8への自動フォールバックや30日データ保持(ZDR不可)といった固有の前提条件は、冒頭で挙げたClaude Fable 5の解説記事で確認してから本番投入する流れが安全です。
Q2. OpusとSonnetの差はどれくらい?
タスクによります。明確な判定基準がある抽出 / 分類ではHaikuでもOpusと遜色ない精度が出ます。深い推論(多段論理 / 戦略立案 / 多観点採点)ではOpusの優位が明確に出ます。「迷ったらSonnetで実験、品質に不満ならOpusに上げる」運用が安定です。
Q3. Haikuの精度はどこまで信頼できる?
機械的な判定基準が明確なタスク(JSON抽出、明示パターンの分類、URL抽出、字数カウント等)はHaikuで十分な精度が出ます。一方で「微妙な独自視点の評価」「キュレーション感の検出」のような曖昧な判断はHaikuでは精度が出ないため、Opus / Sonnetを使います。
Q4. Claude Codeはどのモデルを使う?
デフォルトモデルはアカウント種別で異なり、Max / Team Premium / Enterprise(従量課金)/ Anthropic API経由ではOpus 4.8、Pro / Team Standard / Enterprise(サブスクリプションシート)ではSonnet 4.6が使われます。/model コマンドで切替でき、v2.1.170以降ではFable 5も選べます(どのアカウント種別でもFable 5がデフォルトになることはありません)。MaxプランのOAuth認証では各モデルの累計利用上限が緩く設定されており、Opusも日常的に使えます。
Q5. モデルが進化したら過去のプロンプトを書き直すべき?
基本的には不要です。Anthropicはモデル間の挙動互換性を保つ方針で、Opus 4.7 → 4.8のような同系統内の更新では大きな書き換えは必要ありません。ただし思考深度の制御を活かすなら、Opusはeffortの指定、Sonnet / HaikuはExtended Thinkingのthinkingパラメータといった軽微な変更で効果を引き出せます。
Q6. AWS Bedrock / Google Vertex AIと直APIの違い?
ClaudeモデルはAWS Bedrock / Google Vertex AI経由でも利用できます。価格 / リージョン / 認証フロー / SLAが異なるため、組織の既存クラウド契約に合わせて選択します。提供形態ごとの違いは、前述のAnthropic API完全ガイドで扱っています。
まとめ
Claudeモデル選択の設計判断軸は次の4つに集約されます。
- デフォルトはSonnet:大半のタスクで適切なバランス
- 判断軸が複雑 / 独自性が必要 → Opus:採点 / レビュー / 戦略 / 研究
- 明確な判定基準 / 抽出系 → Haiku:バッチ / 抽出 / 速報
- 長く曖昧な自律タスク → Fable 5:単価2倍を回収できる重いタスクに絞って投入
コスト最適化はモデルルーティング + Prompt caching + Batch APIの3軸を組み合わせて1/10〜1/20に圧縮できます。Opusのeffort(xhigh)や料金・提供形態の詳細は、本文中で挙げた関連記事を参照してください。
モデル選択は四半期ごとの新版でベスト解が変わるため、本記事の判断軸は時期を問わず効くフレームワークとして読み、具体的なスペックや料金は公式ドキュメントで最新を確認してください。
関連する記事
Claude をもっと見る →Claude Fable 5とは — 1Mコンテキスト・$10/$50のMythosクラスを仕様から使い方まで整理
Claude Opus 4.7 xhighとは — 従来effortとの違いとコスト試算
think toolとは — Claudeに考える間を与える設計とextended thinkingの使い分け
Agents in biology — ウイルス配列取得をgget virusで99.7%まで揃えた研究
Claude Opus 4.7がNMR予測でChemDrawとMestReNovaに並ぶ — 化学領域第1報
Claude商用利用の可否・生成物の権利・データ学習のオプトアウトをプラン別に確認する