Claude Media
Fable 5が7月1日に再開 — 輸出管理解除と新セーフティ分類器、業界jailbreak基準の共同策定へ

Fable 5が7月1日に再開 — 輸出管理解除と新セーフティ分類器、業界jailbreak基準の共同策定へ

AnthropicがFable 5を7月1日に世界再開。輸出管理指示の解除を受け、Amazon報告のバイパスに対応した新分類器で99%以上を遮断しつつ、Mythos 5も一部米国組織向けに復旧、業界共通のjailbreak深刻度枠組みも並行して打ち出しました。

要点

2026年6月30日、AnthropicはFable 5とMythos 5への輸出管理指示が同日付で解除されたと発表しました。Fable 5は翌7月1日から世界のClaude Platform / Claude.ai / Claude Code / Claude Cowork上で提供を再開します。6月12日の全停止から18日ぶりの復帰で、単に元に戻すだけでなく、Amazon研究者が報告したバイパス手法に対応した新しいセーフティ分類器や、業界共通のjailbreak評価枠組み、米政府との連携強化が同時に打ち出されました。

  • Fable 5は7月1日から世界再開:Claude Platform、Claude.ai、Claude Code、Claude Cowork上で利用可能に戻る
  • サブスクは7月7日まで週次上限の最大50%相当をFable 5に充当可能:Pro / Max / Team / 一部Enterpriseが対象、その後はusage credits経由に切り替わる
  • AWS / Google Cloud / Microsoft Foundryはできる限り速く再開:具体日は未提示
  • Mythos 5は米政府の6月26日承認を受けて一部米国組織で復旧:Glasswingの国内・国外パートナーへは順次拡大予定
  • 新セーフティ分類器はAmazon報告のバイパス手法を99%超で遮断:遮断時のフォールバック先はOpus 4.8
  • 業界共通のjailbreak深刻度枠組みを策定中:Amazon / Microsoft / Google / Glasswingパートナーと共同、HackerOneでFable 5向け報奨プログラムも開始予定
  • 米政府との連携を強化:事前テスト・情報共有・研究協力を拡張、既存の約2年に及ぶ協働を土台に

能力の広さを守りつつ、運用面の摩擦を制度と技術の両面で減らす」という設計になっており、Fable 5の停止が単発の対応で終わらず、業界全体のセーフガード運用の建て付け直しに繋がっている点が読みどころです。6月9日の初回発表と6月12日の全停止を含めた一連の流れは、Fable 5とMythos 5の発表まとめFable 5とMythos 5のアクセス停止で経緯を追えます。

あなたの利用フローはどう変わるか

Claude APIとClaude Platform利用者:7月1日からclaude-fable-5を再度呼べる

claude-fable-5のモデルIDは7月1日からClaude Platform経由で再び利用できるようになります。6月12日以降Opus 4.8にフォールバックしてきたワークロードは、モデル指定を戻すだけで基本的に動く構成が多いはずです。ただし今回は分類器が更新されており、日常的なコーディング / デバッグ用途でも良性リクエストの遮断が以前より増える可能性が明示されています。遮断時の挙動は変わらずOpus 4.8への自動フォールバックで、ユーザーには通知されます。

AWS / Google Cloud / Microsoft Foundry経由の利用は「できる限り速く再開する」とだけ述べられており、具体日は示されていません。マネージド提供に依存している場合、当面はClaude Platform経由での復旧を先行させ、クラウドプラットフォーム経由の切り戻しは各プロバイダのアナウンスを見てからの二段階を想定しておく方が安全です。

サブスクユーザー(Pro / Max / Team / 一部Enterprise):7月7日まで週次上限の最大50%相当

Pro / Max / Team、および一部のEnterpriseプランでは、7月7日までFable 5利用が週次利用上限の最大50%相当まで含まれる扱いになります。中断していた期間を挟むため、6月9日発表時点の「6月22日まで無償同梱」とは料金設計が組み直された形です。7月8日以降はusage credits経由に切り替わり、消費ベースでFable 5を選ぶかOpus 4.8で回すかを利用者側で選ぶことになります。

7日間の実質フル利用枠は「短期間で本番導入可否を判断してほしい」という誘引に読めます。Fable 5の追従性と安全装置のトレードオフをこの1週間でどう評価するかが、8日以降の運用設計の分かれ目になります。

Claude Codeとエージェント実装:モデル選択のロジックを二段で

Claude Codeでは、Fable 5をサブエージェントの中核モデルに据えていた構成の切り戻しが可能になります。ただし今回の分類器更新は「benignなリクエストでも今より多く遮断される」と明記されており、長時間ハーネスや自律タスクではフォールバック発動頻度が上がる想定を入れておく必要があります。

現実的な組み方は、タスク種別ごとに claude-fable-5 / claude-opus-4-8 を明示的に切り替えるルーティングを用意しておく形です。セキュリティ関連コードや脆弱性調査に関わるコンテキストは初手からOpus 4.8に振り、追従性を求める長尺タスクだけFable 5に投げる分岐にすると、フォールバックによる中断で流れが崩れにくくなります。設計方針はClaude Code完全ガイドのサブエージェント章にある「モデル選択の階層化」に沿う形で組めます。

Project Glasswingパートナーと米国組織:Mythos 5が段階的に復旧

Mythos 5は6月26日の米政府承認を経て、一定の米国組織向けにアクセスが復旧しています。Glasswingの国内・国外パートナー全体への拡大は「引き続き政府と調整する」とされ、順次段階的に広がる想定です。Glasswingの目的と初期報告はProject Glasswing 1ヶ月レポート、拡大フェーズの体制はProject Glasswing拡大の続報にまとめています。

影響度早見表

利用形態別の影響度合いを段階語彙で示すと、7月1日以降の初動が組み立てやすくなります。

利用形態影響度取るべき対応
Claude Platform経由のFable 5顧客影響度明確な恩恵あり取るべき対応7月1日にモデル指定を戻す、分類器強化に伴う遮断頻度を実測
Pro / Max / Team / 一部Enterprise影響度明確な恩恵あり取るべき対応7月7日までの50%上限内で本番導入可否を短期評価
AWS / Google Cloud / Microsoft Foundry経由影響度条件次第取るべき対応各プロバイダのアナウンスを待って段階復旧
Claude Codeサブエージェント運用影響度条件次第取るべき対応セキュリティ文脈はOpus 4.8、追従性重視はFable 5の二段ルーティング
Project Glasswingパートナー(米国)影響度明確な恩恵あり取るべき対応Mythos 5復旧の対象範囲を確認、防御サイバー運用を再開
Project Glasswingパートナー(国外)影響度条件次第取るべき対応政府調整の進捗を待つ、当面はMythos Preview世代で運用継続
Opus 4.8 / Sonnet系のみ利用影響度ほぼ影響なし取るべき対応変更は分類器周辺のみ、通常運用のまま

一連の経緯タイムライン

Fable 5 / Mythos 5の再開までの流れを、初回発表から遡って並べると、輸出管理の運用と分類器改良が並行して走った様子が見えます。

日付出来事位置付け
2026-06-09出来事Fable 5 / Mythos 5の一般公開位置付けMythosクラスが広く解放される
2026-06-12出来事米政府の輸出管理指示で全停止位置付けAmazon研究者の報告が発端
2026-06-12〜6-25出来事Anthropic・政府・Amazonで報告内容と証拠を精査位置付け他モデルでも同等能力があると判明
2026-06-26出来事米政府がMythos 5の一部復旧を承認位置付け国内の信頼組織向けに再開
2026-06-30出来事輸出管理指示が解除される位置付け新分類器と業界枠組みの発表と同時
2026-07-01出来事Fable 5が世界再開位置付けClaude Platform / Claude.ai / Code / Cowork
2026-07-07出来事サブスクの50%上限充当が終了位置付け以降はusage credits経由に移行

背景・文脈

バイパス手法の実像と、他モデルでも再現した事実

輸出管理指示のきっかけになったのは、AmazonリサーチャーがFable 5のセーフガードを回避してソフトウェア脆弱性を特定させ、1件については実際にエクスプロイト可能なコードを生成させたという報告でした。この2週間、Anthropicは政府とAmazonを含むパートナーと連携して報告を検証してきたことになります。

検証の要点は、同じ脆弱性の特定は多くの一段能力の低いモデルでも可能で、エクスプロイトのデモに至っては検証した全モデルで再現したという点です。名指しで挙げられているのはClaude Opus 4.8、GPT-5.5、Kimi K2.7、そしてエクスプロイト再現側にはClaude Haiku 4.5、Sonnet 4.6、Opus 4.6、Opus 4.7、Opus 4.8、GPT-5.4、GPT-5.5、Kimi K2.7が含まれます。Fable 5固有の上乗せは無く、Mythos級の希少能力にも該当しないというのがAnthropicの結論で、これは6月12日時点で示した見解(Fable 5 / Mythos 5のアクセス停止)と同じ方向性です。

とはいえ「他モデルでも起きる」からといって対応をしない選択にはならず、政府と協力して該当挙動をターゲットにする新セーフティ分類器を訓練し、リリース時に組み込む形にしています。

新セーフティ分類器の性能と副作用

新分類器は、Amazon報告で示された具体的手法を99%超で遮断します。ごく少数のケースではモデルが情報を返すことがあるものの、その内容はサイバー攻撃者の助けになるほどの詳細さは持たないとされます。米商務省のCenter for AI Standards and Innovation(CAISI、AI標準・イノベーション センター)の研究者が旧セーフガードと新セーフガードの両方を検証し、いずれも「非常に強力(extraordinarily strong)」と評価している点も明記されています。

副作用として、通常のコーディングやデバッグ作業でも良性リクエストが以前より多く遮断される可能性が示されています。分類器は継続的に調整され、悪意ある利用と正当な要求を区別する精度を上げていくとされます。運用側から見ると、7月1日以降のFable 5には「安全側に寄せた分類器 + Opus 4.8フォールバック」という二段構えがあり、これを前提にプロンプト設計とルーティングを組む形になります。

なぜFable 5のセーフガードは広めに引かれているか

背景として、Anthropicは今回改めて自社のセーフガード運用の考え方を整理しています。Mythos 5はソフトウェア脆弱性の発見と悪用において他のどのモデルより優れ、熟練した人間セキュリティ専門家を除けば最も強力とされ、悪意ある利用者にとって特に魅力的な標的になります。一方Fable 5は同じ基盤モデルでありながら、こうした攻撃的な独自能力を提供しない設計です。この差を生んでいるのが、Anthropic史上最も強力なセーフガード群の適用です。

Fable 5の準備段階で、Anthropicは社内他チームからのスタッフ異動によって取り組みに従事する研究者・エンジニアを倍増させています。個々のメカニズムは単独では完全な防御にならないため、Defense in depth(多層防御)として組み合わせる設計です。訓練による危険要求の拒否、事後の利用パターン分析、そしてリアルタイムで危険操作を検出して遮断する分類器が並列で動いています。

「セーフティマージン」の考え方と、jailbreakの深刻度分類

Anthropicが今回強調しているのが「セーフティマージン」という概念です。分類器を意図的に明らかに良性のリクエストにも発火するよう広めに設定することで、少しでも危うい要求は境界に近づいた時点で止まる仕組みです。Fable 5ではこのマージンを過去最大まで広げており、良性リクエストの誤検知が増える負担を承知の上で、能力の広さを一般利用者にも届けるトレードオフを取っています。

jailbreakとの関係でみると、多くのjailbreakはごく狭いモデル挙動だけを解放する性質があり、セーフティマージン内までは踏み込めても、Anthropicが本当に止めたい中核的な有害挙動には届かないという整理になります。Anthropicの見解では、これまでにFable 5に対して報告されたjailbreakはこの「軽微カテゴリ」に収まっており、深刻度の高いjailbreakは現時点で発見されていません。

深刻度を段階で捉えると、①軽微(セーフティマージン内)、②狭い有害jailbreak(特定の有害挙動を解放するが範囲が限定的)、③汎用jailbreak(広範な有害挙動を解放、最も懸念される)という並びで整理されています。汎用jailbreakは「あらゆるAIモデルで完全に堅牢にすることは恐らく不可能」という前提のもとで、専門的レッドチームが継続的に探索し、悪意ある利用者より先に発見・修正する運用が想定されています。

業界共通のjailbreak深刻度枠組み

今回の一連の対応で浮かび上がったもう一つの課題は、AI業界にjailbreakの深刻度を客観的に評価する共通枠組みが存在しないという事実です。新しい手法が発見されるたびに、開発者側はどの発見を最優先で扱うべきか、政府側はいつ介入すべきかが不明瞭になります。今後さらに強力なサイバーセキュリティ能力を持つモデルが増えると、この曖昧さのコストは急速に大きくなります。

そこでAnthropicはAmazon、Microsoft、Google、その他のGlasswingパートナーと組んで、jailbreak深刻度の共通評価枠組みの草案を策定中です。他のモデル提供者にも参加を呼びかけています。現時点の提案では、jailbreakを4つの基準でスコア化するとされ、うち2つは「攻撃者に何を提供するか」を、残り2つは「その被害がどれだけ速く現実になるか」を評価する軸です。

最も深刻なクラス(発電網や銀行システムなど重要インフラに致命的な影響を与えている用途で実際に使われている等の条件を満たすもの)については、確認と同時に暫定緩和策を即座に展開する運用が想定されています。24時間体制でjailbreak報告チャネルを監視するチームも新設されます。並行して、セキュリティ研究者がFable 5(利用可能になり次第)で発見したjailbreakを提出できるHackerOneプログラムも新設されます。

安全装置の設計思想の土台は、2025年に示されたConstitutional Classifiersの解説にある二重検査の延長線上にあり、今回の共通枠組みはその運用面を業界全体に広げようとする動きと読めます。

米政府との連携強化とExecutive Order

今回の一連の対応と並行して、Anthropicはこの10週間、米政府が6月2日付の「Promoting Advanced Artificial Intelligence Innovation and Security」大統領令の方針を策定する過程で緊密に協働してきたと述べています。関与範囲は、Office of the National Cyber Director、Office of Science and Technology Policy、財務省、商務省(CAISIを含む)、および関連する国家安全保障の担当機関に及びます。

Anthropicはこの協働を継続する意向で、事前デプロイテストと評価に関する約2年の既存協力を土台に、新たな政府協働のスケールアップ策を提案しています。声明で明示されているのは、「政府の関与が必要な場面では、透明・公平・明確・技術的事実に根ざした強固な規制で成文化されるべき」という原則と、「AIリリースへの政府関与には、サイバー防御側等が強力なモデルへのアクセスに関して必要な確実性を持てる、持続的で透明な手続きが必要」という条件です。6月12日声明で示された「履行しつつ判断プロセスには異議」という構図(Fable 5とMythos 5のアクセス停止)と地続きの主張で、今回はその建て付け直しを具体プロセスの提案として示している形です。

編集視点:「停止 → 復旧」ではなく「停止 → 制度化」への転換

6月9日の登場から6月12日の全停止、そして6月30日の解除・7月1日の復旧まで、Fable 5を巡る22日間の展開は、単に「輸出管理指示が出て、解除された」という往復では終わっていません。同じタイミングで新セーフティ分類器・業界共通jailbreak枠組み・米政府協働の強化という3つの制度的な打ち手が同時に置かれた点が特徴です。

Anthropic側の視点で読むと、6月12日声明で述べていた「輸出管理プロセスがどの程度の根拠で発動されるか」という論点は、今回の解除で決着したわけではなく、「今後は共通枠組みで深刻度を測り、それに応じて対応する」という運用ルールの提案に置き換えられています。CAISIによる新旧セーフガードの検証、業界パートナーとの共通枠組み、HackerOneでの外部報告受付、24時間監視チームまで含めると、次回同種の事象が起きた際に「即時全停止」という選択肢に頼らずに済むためのインフラを、今回の期間で並行して仕込んだ形と読めます。

一方で分類器強化に伴う良性遮断増は、Fable 5の使い勝手にとって直接のコストです。7月1日以降の運用では、「セーフティマージンが広い前提でルーティングを組む」ことが標準化していく可能性があります。Opus 4.8がフォールバック先として引き続き主力を担うため、Opus 4.8の解説にある「同価格底上げ」と「effort調整」の効き方を再確認して、二段運用の下位側を安定させる意義が大きくなります。

まとめ

  • Claude Platform経由でFable 5を本番運用しているチーム:7月1日にモデル指定を戻し、分類器強化による遮断頻度の実測を早めに行う
  • Pro / Max / Team / 一部Enterpriseサブスクユーザー:7月7日までの50%上限充当で本番導入可否を短期評価、8日以降のusage credits運用を見据える
  • AWS / Google Cloud / Microsoft Foundry経由の利用者:各プロバイダのアナウンス待ち、当面はClaude Platform経由の復旧に頼る二段構え
  • Claude Codeでエージェント実装中のチーム:セキュリティ文脈はOpus 4.8、追従性重視はFable 5という二段ルーティングを用意
  • Project Glasswingの米国パートナー:Mythos 5復旧の対象範囲を確認して防御サイバー運用を再開、国外パートナーは政府調整の進捗を追う
  • セキュリティ研究者:Fable 5向けの新HackerOneプログラムを通じてjailbreak報告を提出できるようになる予定
  • 政策・規制watcher:業界共通のjailbreak深刻度枠組みと、米政府との協働強化がどう他社に波及するかが今後の観測点

7月1日再開後の24時間から数日でFable 5の新分類器がどれだけ良性リクエストを巻き込むか、そして共通枠組みが他のモデル提供者にどこまで受け入れられるかが、今回の建て付けが実効的なインフラに育つかを分ける観測点になりそうです。Fable 5とMythos 5の初回発表と停止までの経緯はFable 5とMythos 5の発表まとめFable 5とMythos 5のアクセス停止、安全装置の考え方の土台はConstitutional Classifiersの解説に整理しています。

この記事を共有:XLinkedIn