Claude Media
Claudeモデル比較2026 — Fable 5 / Opus / Sonnet / Haikuの使い分け

Claudeモデル比較2026 — Fable 5 / Opus / Sonnet / Haikuの使い分け

ClaudeにはFable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5の4系統があります。スペック・料金・思考の仕組み・コスト最適化まで、Mythosクラス登場後の最新構成で用途別の使い分けを比較します。

ClaudeにはFable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5の4系統のモデルがあります。スペック・料金・推論深度・速度・主用途・思考の仕組み・コスト最適化を軸に、どのタスクにどのモデルを選ぶかを比較します。

4系統の位置付け — Mythosクラスが加わった2026年6月以降の構成

Claudeモデルは「知能の深さ」「速度」「コスト」のトレードオフが異なる系統で提供されています。長らくOpus / Sonnet / Haikuの3系統でしたが、2026年6月9日にOpusクラスの一段上にあたるMythosクラスの一般提供版Claude Fable 5が加わり、選択肢は4系統になりました。ここでは2026年6月時点の最新版(Fable 5 / Opus 4.8 / Sonnet 4.6 / Haiku 4.5)を比較します。

モデル強み主用途推論深度速度
Claude Fable 5強みフロンティア能力、長く複雑なタスクほど差が出る主用途長時間の自律タスク / 大規模コードベース横断 / 曖昧な根本原因調査推論深度最高速度中程度
Claude Opus 4.8強み最高水準の推論、adaptive thinking + effort制御主用途重い思考 / 戦略立案 / コードレビュー / 研究推論深度速度中程度
Claude Sonnet 4.6強み速度と品質のバランス、汎用最強主用途標準的な執筆 / 調査 / 製品統合 / コーディング推論深度速度
Claude Haiku 4.5強み高速 + 安価、構造的タスクで精度を保つ主用途抽出 / 採点 / 速報処理 / 軽量バッチ推論深度速度最高

「最初に試すならSonnet」「重い思考はOpus」「コスト最適化はHaiku」という従来の原則に、「長く曖昧な自律タスクはFable 5」が加わった形です。なおMythosクラスには安全装置を一部外したClaude Mythos 5もありますが、Project Glasswing経由の限定提供のため、一般に選べるのはFable 5です。Fable 5固有の仕様(安全装置とOpus 4.8への自動フォールバック、30日データ保持、サブスクでの提供条件など)はClaude Fable 5の解説で詳しく扱っているため、本記事では他系統との比較に絞ります。

スペック比較表

各モデルの公式スペック(2026年6月時点)を以下にまとめます。最新値はAnthropic公式model overviewpricingで確認してください。

項目Fable 5Opus 4.8Sonnet 4.6Haiku 4.5
コンテキスト長(入力)Fable 51,000,000 tokensOpus 4.81,000,000 tokensSonnet 4.61,000,000 tokensHaiku 4.5200,000 tokens
出力上限Fable 5128,000 tokensOpus 4.8128,000 tokensSonnet 4.664,000 tokensHaiku 4.564,000 tokens
Adaptive thinking(effortで制御)Fable 5✓(常時オン・オフ不可)Opus 4.8✓(low〜xhigh)Sonnet 4.6Haiku 4.5
Extended Thinking(budget_tokens)Fable 5Opus 4.8Sonnet 4.6Haiku 4.5
Vision(画像理解)Fable 5Opus 4.8Sonnet 4.6Haiku 4.5
Prompt cachingFable 5Opus 4.8Sonnet 4.6Haiku 4.5
Batch APIFable 5Opus 4.8Sonnet 4.6Haiku 4.5

「思考の仕組み」と「出力上限」が最も大きな差別ポイントです。Fable 5とOpus 4.8はadaptive thinkingに一本化されており、effortパラメータで推論深度を調整します(Fable 5はthinkingを無効化できない点が特徴です)。Sonnet 4.6はadaptive thinkingとExtended Thinkingの両方に対応し汎用バランスが強み、Haiku 4.5はExtended Thinkingに対応しつつ速度と単価で優位です。なおFable 5はOpus 4.7世代のtokenizerを使うため、同じテキストでも旧世代モデルよりトークン数がおよそ30%多くカウントされる点はコスト見積もりで考慮が必要です。

料金比較(参考、2026年6月時点)

料金は時期と契約形態で変動します。本記事は構造を伝える目的で、執筆時点の参考値を示します。正確な値は公式pricingを参照してください。

モデルinput(per 1M tokens)output(per 1M tokens)cache writecache read(90% off)
Fable 5input(per 1M tokens)$10output(per 1M tokens)$50cache write$12.50cache read(90% off)$1
Opus 4.8input(per 1M tokens)$5output(per 1M tokens)$25cache write$6.25cache read(90% off)$0.50
Sonnet 4.6input(per 1M tokens)$3output(per 1M tokens)$15cache write$3.75cache read(90% off)$0.30
Haiku 4.5input(per 1M tokens)$1output(per 1M tokens)$5cache write$1.25cache read(90% off)$0.10

Fable 5の単価はOpus 4.8のちょうど2倍、Opusの入力単価はSonnetの約1.7倍、HaikuはSonnetのおよそ1/3です。同じ作業量でも単価が高いぶん、Fable 5とOpusは判断の質が効く場面に絞って使うとコスト効率が上がります。

Batch APIを使うと全モデルで50% 割引、Prompt cachingを使うとcache読込部分がinputの0.1x(90% 割引)になり、累計コストを大きく下げられます。料金の内訳はAnthropic API完全ガイド2026で詳しく扱っています。

用途別使い分け早見表

実運用で「このタスクにはどのモデルを選ぶべきか」の判断を素早く下せるよう、よくある業務と推奨モデルの対応をまとめます。

業務推奨モデル理由
長時間の自律エージェントタスク推奨モデルFable 5理由タスクが長く複雑なほど他モデルとの差が広がる
大規模コードベース横断の調査 / 移行推奨モデルFable 5理由1Mコンテキスト + 128K出力で分割せずに扱える
戦略立案 / 編集視点付きの記事執筆推奨モデルOpus 4.8理由深い推論と独自視点が必要
コードレビュー(差分の品質チェック)推奨モデルOpus 4.8理由多観点の同時評価 + 提案の質
アーキテクチャ設計 / 設計レビュー推奨モデルOpus 4.8理由制約の同時考慮と判断
標準的な実装作業推奨モデルSonnet 4.6理由速度と品質のバランス
一般的な調査 / WebFetch + 要約推奨モデルSonnet 4.6理由適切な情報統合
製品統合(LLM応答 → ユーザー)推奨モデルSonnet 4.6理由ユーザー体験のレイテンシと品質
抽出系(構造化JSON出力)推奨モデルHaiku 4.5理由速度 + 単価、精度も十分
大量バッチ採点(明確な判定基準)推奨モデルHaiku 4.5理由累計コストが効く
ログ要約 / 単純分類推奨モデルHaiku 4.5理由パターン処理の典型
リアルタイムチャット応答推奨モデルHaiku 4.5理由体感速度が決定的
RAGでの検索結果合成推奨モデルSonnet 4.6 + Prompt caching理由キャッシュとセットで最適化
多段推論を伴う研究タスク推奨モデルOpus 4.8(effort=xhigh)理由effortを上げて推論深度を引き上げ

選び方の原則:

  1. デフォルトはSonnet:ほとんどのユースケースはSonnetで十分。コスト感も実用範囲
  2. 判断軸が複雑 / 独自性が必要 → Opus:採点 / レビュー / 戦略立案で品質を取りに行く
  3. 明確な判定基準 / 抽出系 → Haiku:既知パターンの分類、JSON抽出、ログ要約
  4. 長く曖昧な自律タスク → Fable 5:時間のかかる調査・移行・実装を丸ごと任せる場面で単価2倍を回収しやすい。攻撃的セキュリティや生物研究など安全装置のフォールバックが頻発するドメイン、ZDR(ゼロデータ保持)必須の組織はOpus 4.8が無難

すべてをFable 5に寄せるより、「従来構成で時間がかかっている・途中で迷走しがちなタスク」だけFable 5へ振り替えて完了率と所要時間を比べる併用構成が、コスト管理の面でも入りやすいところです。

思考深度の制御 — effortと2種類のthinking

応答前に内部で「思考」フェーズを挟む仕組みには、現在2つの方式があります。両者は対応モデルが異なるため、コードを書く前に使い分けを押さえておくと安全です。

  • Adaptive thinking(effortで制御):Fable 5・Opus 4.8・Sonnet 4.6が対応します。Opus 4.8ではeffortパラメータ(low / medium / high / xhigh / max)で思考の深さを指定し、既定はhighです。難問にはxhighを指定して推論深度を引き上げます。Fable 5はadaptive thinkingが常時オンで、{"type": "disabled"}によるthinkingの無効化が非サポートという点だけ他モデルと異なります。
  • Extended Thinking(budget_tokensで制御):Sonnet 4.6とHaiku 4.5が対応します。thinking: {"type": "enabled", "budget_tokens": 32000} のように思考トークンの予算を渡す方式です。

注意点として、Fable 5とOpus 4.8ではbudget_tokens方式のExtended Thinkingは使えません(Opus 4.7以降でこの指定は400エラーになります)。思考深度を上げたいときはeffortを上げる、というのが現行の正しい方法です。

深い思考が効くのは次のような用途です。

  • 多段推論が必要な問題(数学 / コーディング / 戦略立案)
  • 独自視点の生成(レビュー / 採点 / 編集解釈)
  • 多変数の最適化(複数制約を満たす設計案の比較)

逆に深い思考が無駄になりやすいのは、「単純な抽出 / 分類 / フォーマット変換」のような決まったパターン処理です。これらはHaiku / Sonnetの通常応答で十分です。

xhighはOpusのeffortレベルの一つで、より深い推論を許可して難問への対応力を引き上げます。仕組みの詳細はOpusのxhighモードの深掘りを参照してください。

コスト最適化の3軸

実運用でコストを大きく下げる手法を3つ紹介します。

1. モデルルーティング

タスク別にOpus / Sonnet / Haikuを振り分けます。本サイト(Claude Media)の例:

  • 記事生成のドラフト(draft-writer): Sonnet
  • 4観点採点(quality-judge): Opus(精度が決定的)
  • 単純抽出(competitive-analyzer のURL一覧抽出): Haiku
  • 個人情報検出 / 字数カウント: Haiku(機械検証で十分)

これだけで累計コストがOpus一律と比べて60〜80% 削減できます。

2. Prompt caching

システムプロンプト・ツール定義・RAGコンテキストの静的部分cache_control: {"type": "ephemeral"} でキャッシュ化します。後続リクエストで90% 割引(cache read = inputの0.1x)。

典型的な効果:

  • システムプロンプト10,000 tokensを100リクエスト再利用 → cacheなし $30 / cacheあり $3
  • 長いRAGコンテキスト(50,000 tokens)を50リクエストで再利用 → 大幅な節約

詳細はAnthropic API Prompt caching完全活用を参照してください。

3. Batch API

即時性が不要なバルク処理(数千〜数万件)はBatch APIで50% 割引。24時間以内に結果が返ります。

主用途:

  • 月次レポート / 大量翻訳 / データセット作成
  • リアルタイムでなくてよいRAGインデックス再生成
  • 大量記事生成 / 採点

この3つを組み合わせると、累計コストは「Opus一律で全部API直叩き」比で1/10〜1/20に圧縮できます。

モデルIDと切り替え

Anthropic APIでモデルを指定するときのIDは次のとおりです(2026年6月時点)。

モデルAPI ID
Claude Fable 5API IDclaude-fable-5
Claude Opus 4.8API IDclaude-opus-4-8
Claude Sonnet 4.6API IDclaude-sonnet-4-6
Claude Haiku 4.5API IDclaude-haiku-4-5-20251001

4.6世代以降のIDは日付サフィックスを持ちませんが、いずれも挙動が固定されたスナップショットで、中身が入れ替わるエイリアスではありません。4.6世代より前のモデルには日付付きIDを指す短縮エイリアス(claude-haiku-4-5claude-haiku-4-5-20251001 等)もありますが、本番運用では明示的なID指定が安全です。エイリアスの解決先が新版に切り替わると、未検証の挙動変化が混入する可能性があるためです。

Claude Codeセッション中は /model コマンドで切替できます(Fable 5はv2.1.170以降で表示されます)。settings.jsonmodel キーでデフォルトを指定する方法と併用します。

よくある質問

Q1. Fable 5はどんなときに選ぶ?

長時間の自律タスク、大規模コードベースを横断する調査・移行、曖昧で大きな問題を丸ごと任せる場面が候補です。タスクが長く複雑になるほど他モデルとの差が広がるとされる一方、単価はOpus 4.8の2倍なので、定型処理では差を回収しにくくなります。安全装置によるOpus 4.8への自動フォールバックや30日データ保持(ZDR不可)といった固有の前提条件は、冒頭で挙げたClaude Fable 5の解説記事で確認してから本番投入する流れが安全です。

Q2. OpusとSonnetの差はどれくらい?

タスクによります。明確な判定基準がある抽出 / 分類ではHaikuでもOpusと遜色ない精度が出ます。深い推論(多段論理 / 戦略立案 / 多観点採点)ではOpusの優位が明確に出ます。「迷ったらSonnetで実験、品質に不満ならOpusに上げる」運用が安定です。

Q3. Haikuの精度はどこまで信頼できる?

機械的な判定基準が明確なタスク(JSON抽出、明示パターンの分類、URL抽出、字数カウント等)はHaikuで十分な精度が出ます。一方で「微妙な独自視点の評価」「キュレーション感の検出」のような曖昧な判断はHaikuでは精度が出ないため、Opus / Sonnetを使います。

Q4. Claude Codeはどのモデルを使う?

デフォルトモデルはアカウント種別で異なり、Max / Team Premium / Enterprise(従量課金)/ Anthropic API経由ではOpus 4.8、Pro / Team Standard / Enterprise(サブスクリプションシート)ではSonnet 4.6が使われます。/model コマンドで切替でき、v2.1.170以降ではFable 5も選べます(どのアカウント種別でもFable 5がデフォルトになることはありません)。MaxプランのOAuth認証では各モデルの累計利用上限が緩く設定されており、Opusも日常的に使えます。

Q5. モデルが進化したら過去のプロンプトを書き直すべき?

基本的には不要です。Anthropicはモデル間の挙動互換性を保つ方針で、Opus 4.7 → 4.8のような同系統内の更新では大きな書き換えは必要ありません。ただし思考深度の制御を活かすなら、Opusはeffortの指定、Sonnet / HaikuはExtended Thinkingのthinkingパラメータといった軽微な変更で効果を引き出せます。

Q6. AWS Bedrock / Google Vertex AIと直APIの違い?

ClaudeモデルはAWS Bedrock / Google Vertex AI経由でも利用できます。価格 / リージョン / 認証フロー / SLAが異なるため、組織の既存クラウド契約に合わせて選択します。提供形態ごとの違いは、前述のAnthropic API完全ガイドで扱っています。

まとめ

Claudeモデル選択の設計判断軸は次の4つに集約されます。

  1. デフォルトはSonnet:大半のタスクで適切なバランス
  2. 判断軸が複雑 / 独自性が必要 → Opus:採点 / レビュー / 戦略 / 研究
  3. 明確な判定基準 / 抽出系 → Haiku:バッチ / 抽出 / 速報
  4. 長く曖昧な自律タスク → Fable 5:単価2倍を回収できる重いタスクに絞って投入

コスト最適化はモデルルーティング + Prompt caching + Batch APIの3軸を組み合わせて1/10〜1/20に圧縮できます。Opusのeffort(xhigh)や料金・提供形態の詳細は、本文中で挙げた関連記事を参照してください。

モデル選択は四半期ごとの新版でベスト解が変わるため、本記事の判断軸は時期を問わず効くフレームワークとして読み、具体的なスペックや料金は公式ドキュメントで最新を確認してください。

この記事を共有:XLinkedIn