Claude Media
Claude Sonnet 5が登場 — Opus 4.8に迫る性能を低価格で、デフォルトモデルとして全プランへ

Claude Sonnet 5が登場 — Opus 4.8に迫る性能を低価格で、デフォルトモデルとして全プランへ

AnthropicがClaude Sonnet 5を6/30に提供開始。Sonnet 4.6の後継で、Opus 4.8に迫るエージェント性能を低価格で提供。Free / Proの既定モデルに採用され、Claude Codeとプラットフォームでは8月末までの導入価格が適用されます。

要点

2026年6月30日、AnthropicはSonnetクラスの新モデルClaude Sonnet 5を提供開始しました。API model IDはclaude-sonnet-5。Sonnet 4.6の後継で、「これまでで最もエージェント的なSonnet」と位置付けられています。

  • Opus 4.8に迫る性能を、より低い価格で:数か月前まで上位モデルが必要だったブラウザ操作・ターミナル操作・自律実行を、Sonnetクラスの単価で回せる水準
  • 導入価格(2026年8月31日まで):入力100万トークンあたり2ドル、出力100万トークンあたり10ドル
  • 標準価格(9月1日以降):入力100万トークンあたり3ドル、出力100万トークンあたり15ドル
  • Free / Proプランの既定モデルに採用、Max / Team / Enterpriseでも利用可、Claude CodeとClaude Platformでも同日提供
  • エージェント安全性が向上:悪意ある要求の拒否とプロンプトインジェクション耐性がSonnet 4.6より改善、幻覚と迎合(sycophancy)の発生率も低下
  • サイバー能力は意図的に抑制:Opusモデルより低く、それでもサイバー安全策(cyber safeguards)は既定で有効

Sonnet 5は「Sonnetでどこまで届くか」の到達点を一気に押し上げる更新です。特にSonnet 4.6を主軸に組んできたエージェント / コード自動化のワークロードでは、乗り換えの検討価値が大きいタイプの世代交代と読めます。

あなたの利用フローはどう変わるか

コーディング:Sonnetのままでブラウザ / ターミナルを任せられる

Sonnet 4.6の段階でも、Sonnetクラスはコーディング支援やツール呼び出しで存在感を出していました。Sonnet 5はここにエージェント的な自走が本格的に乗った世代です。計画を立て、ブラウザやターミナルを操作し、明示的に指示しなくても自分の出力を検証しにいく挙動が、上位のOpusクラスを持ち出さなくても手に入ります。

早期アクセスパートナーからの声を要約すると、次の3点が共通しています。

  • 途中で止まらない:従来のSonnetでは道半ばで停止していた複雑なマルチステップタスクを、最後まで走らせやすい
  • 自己検証が入る:バグ調査を頼むと、無指示でも再現テストを書いて修正が効いていることを確認しに行くケースがある
  • 効率が上がる:同等の出力品質を、より少ないステップ数で出す傾向

Claude Code側の使いこなしはClaude Code完全ガイド2026で全体像を追えます。Sonnet 5への切り替えは、Free / Proではモデル選択なしで既定になり、Max / Team / Enterpriseでは既存のSonnet枠と並んで選べます。

ブラウザ操作・コンピュータ操作:効率レベルで幅が広がる

公式のコスト・性能曲線では、エージェント検索のBrowseCompとコンピュータ操作のOSWorld-VerifiedでSonnet 5が測定されており、Sonnet 4.6を全効率レベルで上回るだけでなく、Opus 4.8よりも広いコスト・性能の選択肢を持つと説明されています。

つまりSonnet 5は、単に「Sonnet 4.6より賢い」だけでなく、低〜中effortで安価に流し、必要な場面だけ高effortで深く考えさせる運用ができるモデルとして設計されています。ある局面ではOpus 4.8のスコアに追いつき、別の局面では単価が半分以下で済む——という使い分けが同じモデル内で成立するのが特徴です。

effortレベルの意味合いやlow / medium / high / xhigh / maxの5段階の使い分けは、Claude Opus 4.8の解説記事で整理しています。Sonnet 5とOpus 4.8の間で「effortを上げてSonnetで通す」「effortを下げずOpusに逃がす」の二択を都度選べるようになったことは、コスト設計上の大きな柔軟性です。

業務自動化:Sonnetクラスで「end-to-end完走」が現実に

早期アクセスの声のなかで目立つのは、業務システムをまたぐ多段タスクを、Sonnetのままで一気通貫にできたという証言です。Salesforceのアカウント階層更新と、それに続く社内配信の起票までを1回のセッションで通し切るような例が挙げられています。従来ならば「途中で止まる」「Opusクラスに持ち上げる必要がある」と判断されていた領域です。

日常業務の自動化(社内システム操作 / データ連携 / 定型的な調査と起票)を検討している場合、Sonnet 5の導入価格帯で回るなら、Opusクラスに常時乗せる合理性は薄まります。Opusは設計判断や厳密性の要る局面に温存し、実行レイヤーはSonnetで持つ——という役割分担が組みやすくなります。

Sonnet / Opus / Haikuの役割分担そのものの考え方は、Opus / Sonnet / Haiku使い分けガイドを参照してください。

導入と切り替え:トークナイザ更新に注意

Sonnet 5は新しいトークナイザを採用しています。同じ入力テキストでもトークン化の結果が変わり、ケースによってSonnet 4.6の1.0〜1.35倍のトークン数にマップされます(コンテンツの性質次第で幅があります)。導入価格($2 / $10)はこのトークン増加を織り込んで、Sonnet 4.6からの移行がおおむねコスト中立になるように設定された、と説明されています。

つまり、9月1日以降に標準価格($3 / $15)へ移行すると、同じテキスト量に対してSonnet 4.6より単価が上がる可能性があります。8月末までにワークロードをSonnet 5で走らせ、実測トークン量と単価をSonnet 4.6ベースの見積もりと突き合わせておくと、9月以降の予算策定が読みやすくなります。

背景・文脈

Sonnet 3.5 → 4.6 → 5:「エージェント時代のSonnet」の到達点

公式発表は、多くの開発者にとって「エージェント時代」はSonnet 3.5・3.6・3.7クラスから始まったと振り返っています。ここでの共通体験は、コーディングとツール呼び出しでSonnetクラスが最初に「実務で使える」水準に届いたことです。

一方、より最近のエージェント能力の伸びは、Opusクラス側に集中していました。Opus 4.7でxhigh思考レベルが入り、Opus 4.8で価格据え置きの性能底上げが行われ、ダイナミックワークフローのような上物機能もOpusを軸に整えられてきました。この構図に対し、Sonnet 5はOpusへ寄せていた重心をSonnet側へ戻す更新として読めます。

時期出来事
2026-04-16出来事Opus 4.7が登場xhigh思考レベルとClaude Code側の/ultrareview
2026-05-28出来事Opus 4.8提供開始、effort 5段階整理・fast mode価格3分の1・ダイナミックワークフロー
2026-06-30出来事Sonnet 5提供開始、Opus 4.8に迫る性能・Sonnet帯の価格・Free / Proの既定モデル化

Anthropicは以前から「Opusと同等の能力を、より低コストで提供するモデルの開発」を明言していました。Sonnet 5はその方向にはっきり一歩進んだ更新で、Opusクラスに常時乗せていたワークロードの一部を、Sonnetへ戻せる可能性があります。

安全性:エージェント文脈で「使いやすく安全」に

Sonnet 5の事前デプロイ評価では、Sonnet 4.6と比べて全体的に望ましくない挙動の発生率が低下しています。特にエージェント安全性の側面では次の3点が挙げられています。

  • 悪意ある要求の拒否:プロンプトインジェクション攻撃への耐性が向上
  • 幻覚(hallucination):発生率が低下
  • 迎合(sycophancy):同じく低下

自動化された行動監査でも、誤用への協力や欺瞞のようなアラインメントを外れた挙動の総量はSonnet 4.6より少ないという結果が示されています。ただし、より上位のOpus 4.8やMythos Previewよりは高い水準に留まった項目もあり、詳細はSonnet 5のシステムカードで数値が公開されています。

「エージェントに長く任せられるか」は、モデルの推論性能だけでなく安全性・信頼性の総合力で決まります。Sonnet 5はエージェント文脈の運用で使いやすい方向に安全側でもチューニングされた、という位置付けです。

サイバー能力は意図的に抑制、安全策は既定で有効

Sonnet 5はサイバーセキュリティタスクへの意図的な訓練を行っていません。ルーチンかつ無害なサイバー作業はある程度こなせる一方、エクスプロイト開発のような潜在的に危険なタスクではOpus 4.8やMythos 5より明らかに低い性能に留まると発表されています。

たとえばMozillaと共同で開発されたFirefox 147の脆弱性エクスプロイト評価では、Sonnet 5・Sonnet 4.6ともに動作するエクスプロイトを作成できたケースは0.0%でした(該当脆弱性はFirefox 148で既に修正済み)。Sonnet 5は部分的な成功率がSonnet 4.6より僅かに高く出ていますが、これは特定のサイバー訓練ではなく汎用的な知能向上の副作用と説明されています。

とはいえ「前世代より高い」という事実は残るため、Sonnet 5には既定で「サイバー安全策(cyber safeguards)」が有効化されています。これはOpus 4.7 / 4.8で使われているものと同じ仕組みで、危険なサイバー用途をリアルタイムに検出・遮断します。

一方、Fable 5の再展開で導入されたようなより広範囲を遮断する強めのセーフガードとは異なり、Sonnet 5の安全策は相対的に緩い設定です。Anthropicは「Sonnet 5からの全体的なサイバーリスクは低い」との判断を明示しています。より強い制約を外して防御的サイバー用途で使いたい場合は、Cyber Verification Program(現時点でネイティブのClaude Platform・AWS上のClaude Platform・Microsoft Foundry上のClaudeで提供、Google Vertex上のClaudeにも近く展開予定)への参加が案内されています。既に登録済みの組織は追加手続きなしでSonnet 5に同じアクセスを持てます。

「Sonnet 4.6のスコアが変わっている」理由

発表内の比較チャートでは、Sonnet 4.6の一部スコアが以前の発表値と異なります。理由は評価手法側の更新です。

  • Humanity's Last Exam:採点用モデルを更新し、Sonnet 4.6のスコアを34.6%(ツール未使用) / 46.8%(ツール使用)に改訂
  • OSWorld-Verified:実世界での挙動をより正確に反映するよう実行方法を変更し、Sonnet 4.6のスコアを78.5%に改訂

Sonnet 4.6自体の性能が変わったわけではなく、評価側のメソッド更新に伴う再計測値です。過去のSonnet 4.6ローンチ記事の数値と食い違うのはこのためです。

更新履歴の注意

公式発表は6月30日の初版から、BrowseComp評価に用いたコスト・性能グラフを差し替えています。初版のグラフはエージェント検索の標準手法ではない簡易メソッドに基づいており、Sonnet 5の性能を過小評価していたとAnthropicは説明しています。現行のグラフは、システムカードで用いられている手法(10Mトークン予算 + コンパクション + プログラマティックツール呼び出し)に揃えられており、周辺の本文説明も同時に更新されています。

過去にSonnet 5のBrowseComp数値を初版時点のグラフから引用した資料がある場合、現在の版と数値・解釈が食い違う可能性があります。参照時は現行の公式ページで再確認する運用が安全です。

まとめ

  • Sonnet 4.6を主軸に運用しているチーム:同じSonnet帯で性能・安全性が上がる入れ替え型の更新。乗り換えの検討価値が大きい
  • コスト最適化を進めたいチーム:8月31日までの導入価格($2 / $10)を使い、9月以降の標準価格($3 / $15)でも回るワークロード設計を実測する好機
  • Opusクラスに常時乗せていたエージェント運用:Sonnet 5に落として回るかを再評価するタイミング。落とせない部分だけOpus 4.8に残す設計が組みやすくなる
  • Claude AppのFree / Proユーザー:モデル選択なしで自動的にSonnet 5に切り替わる。Sonnet 4.6時代より複雑な依頼が通る場面が増える見込み
  • サイバー研究・防御用途のチーム:Sonnet 5はサイバー能力が抑制されている前提で使う。より広範囲な作業が必要ならCyber Verification ProgramまたはOpus 4.8を検討

Sonnet 5はAnthropicが繰り返し語ってきた「Opusの能力をより低コストで届ける」という方向を、Sonnetクラスで初めて具体化した世代です。プラン全体の見取り図や料金体系はClaudeの料金プランと選び方、モデル選定の意思決定フローはモデル使い分けガイドもあわせて参照してください。

この記事を共有:XLinkedIn