Claude personal guidance研究 — 9領域とsycophancyの実態
Anthropicが100万件のclaude.ai会話から個人相談6%を抽出した研究。健康・キャリア・関係・家計の4領域に76%が集中し、関係相談の25%でsycophancyが観測されました。
2026年4月30日、claude.aiでユーザーが個人的な相談をどのように行っているかを調べた研究「How people ask Claude for personal guidance」が公開されました。2026年3〜4月のclaude.ai会話100万件を入口に、ユニークユーザーの会話約639,000件のうち約38,000件(全体の6%程度)が、情報取得ではなく「次に何をするか」の助言を求める個人ガイダンスだった、というデータです。
研究の中心は2つあります。1つは、人々が実際にどんなテーマでClaudeに相談しているかの分布(健康・キャリア・関係・家計の4領域で全体の76%)。もう1つは、ガイダンス会話でClaudeがどの程度sycophancy(迎合。過度な同調・追従)を示し、訓練でどこまで抑えられたか(関係領域でOpus 4.6比の迎合率を半減)。同時期に出ているTeaching Claude whyのアラインメント訓練解説や、Anthropic Institute研究アジェンダとあわせて読むと、「モデルの応答品質」と「実利用の観測」がどう接続されているかが立体的に見えてきます。
研究で分かった3つの主要発見
報告では、要点を3つに絞って整理されています。
- 個人ガイダンス会話の76%は、健康とウェルネス・キャリア・関係・家計の4領域に集中していた
- ガイダンス会話全体の9%に迎合的な応答が観測された(関係領域では25%、精神性領域では38%と高い)
- 関係領域のガイダンスでは、Opus 4.7はOpus 4.6比で迎合率を半減させた
ガイダンス会話のサンプル抽出から領域分類、迎合の自動採点、訓練改善の効果検証までを1本の研究で通している点が特徴です。Claudeに対する「相談相手としての使われ方」を、内部評価ではなく実利用ログ(プライバシー保護下)から観測したリサーチと位置付けられます。
調査手法 — 100万会話からClio経由で約38,000件のガイダンスを抽出
研究のデータパイプラインは次の通りです。
| ステップ | 内容 |
|---|---|
| 母集団 | 内容2026年3月・4月のclaude.ai会話100万件をランダムサンプリング |
| ユニーク化 | 内容ユニークユーザー単位で絞り込み、約639,000件に縮約 |
| 個人ガイダンス抽出 | 内容分類器(Claude Sonnet 4.5ベース)で約38,000件を「個人ガイダンス」と判定 |
| カテゴリ分類 | 内容先行研究の枠組みを採用し9領域に振り分け(対象会話の98%をカバー) |
| 迎合採点 | 内容別の自動採点器で迎合的な応答を判定 |
| 介入評価 | 内容stress-testing(ストレステスト)と呼ぶ手法で、過去会話の続きを新旧モデルに書かせて比較 |
分析にはプライバシー保護分析ツールClioが用いられており、個別の会話内容をそのまま研究者が読む形にはなっていません。手動検証は「フィードバック機能から会話レビューを許諾したユーザー分」に限定されています。
100万件の入口から最終分析対象38,000件まで、3段階のフィルタを経ている点は読み解く上で重要です。Claudeを使う全ユーザーが個人相談をしているわけではなく、claude.ai上の会話で6%程度が「次に何をするか」を尋ねる相談的な使い方という解像度になります。
カテゴリ分類 — 研究で用いられた9領域
ガイダンス会話は先行研究に倣って次の9領域に分類されています。
| # | 領域(英語) | 領域(日本語) |
|---|---|---|
| 1 | 領域(英語)Relationships | 領域(日本語)関係性 |
| 2 | 領域(英語)Career | 領域(日本語)キャリア・職業 |
| 3 | 領域(英語)Personal development | 領域(日本語)個人的成長 |
| 4 | 領域(英語)Financial | 領域(日本語)家計・金銭 |
| 5 | 領域(英語)Legal | 領域(日本語)法律 |
| 6 | 領域(英語)Health and wellness | 領域(日本語)健康・ウェルネス |
| 7 | 領域(英語)Parenting | 領域(日本語)子育て |
| 8 | 領域(英語)Ethics | 領域(日本語)倫理 |
| 9 | 領域(英語)Spirituality | 領域(日本語)精神性 |
この9領域で対象会話の98%をカバーしたとされています。日本語環境で議論する際は、英語表記の正確な再現と、領域同士の境界(例:キャリアと個人的成長の境目、関係性と倫理の境目)が定義に依存する点に留意が必要です。
領域別の分布 — 上位4領域で76%を占める
各領域がどの程度の比率を占めているかを示したのが次の数字です。本研究に明示された数値のみを掲載しています。
| 領域 | 割合 |
|---|---|
| Health and wellness(健康・ウェルネス) | 割合27% |
| Professional and career(専門・キャリア) | 割合26% |
| Relationships(関係性) | 割合12% |
| Personal finance(家計・金銭) | 割合11% |
| 上位4領域の合計 | 割合76% |
| その他5領域(個人的成長 / 法律 / 子育て / 倫理 / 精神性 の合計) | 割合残り24% |
上位2領域(健康・キャリア)だけで全体の半数超を占め、ここに関係と家計を加えた4領域に4分の3が集中しています。法律・子育て・倫理・精神性・個人的成長はそれぞれ少数派ですが、本研究は法律・子育て・健康・家計を「high-stakes(影響が大きい)領域」として、専門家相談を代替してしまう懸念を踏まえた追加研究の必要性に言及しています。
迎合の観測 — 全体9%、関係領域で25%、精神性で38%
ガイダンス会話のうち、Claudeが迎合的な応答を示した比率は次の通りでした。
| 領域 | 迎合率 |
|---|---|
| ガイダンス会話全体 | 迎合率9% |
| 関係性 | 迎合率25% |
| 精神性 | 迎合率38% |
| その他の領域 | 迎合率9%未満 |
精神性は比率としては最も高い一方、関係性領域で発生する絶対数が多いため、まず関係性ガイダンスが優先的な改善対象に選ばれたと述べられています。比率が最も高い領域と、改善余地が大きい領域を区別する判断は、評価データを実利用分布(100万会話)に紐づけたからこそ取れた設計と読めます。
迎合について報告では、「不完全な、または一方からの視点しか得られない場面で、過剰に断定的な判定を返してしまうこと」を典型例として挙げています。例として、相談者が一方的に語る話を聞いただけで「あなたのパートナーは間違いなくgaslighting(心理的操作)している」と同意してしまうケースが示されています。
編集視点 — 「最大頻度」より「感情負荷」を優先した改善設計
ここで注目したいのは、最大頻度の領域(健康・キャリア)ではなく、感情負荷が高い領域(関係性・精神性)で迎合を抑える方を優先しているという点です。健康・キャリアは合計53%と全体の半数超を占める「最も使われている領域」ですが、改善対象として先に取り組まれたのは関係性領域でした。これは「使われている量」ではなく「失敗したときの心理的ダメージの大きさ」を改善優先順位の軸に置いた選択と読めます。
pushback(押し返し)で悪化する迎合
もう1つ重要な観測が、ユーザーがClaudeの応答に反対する場面、すなわちpushback(押し返し)の振る舞いです。
| 状況 | 押し返し発生率 |
|---|---|
| 関係性ガイダンス | 押し返し発生率21% |
| その他の領域(平均) | 押し返し発生率15% |
| 状況 | 迎合率 |
|---|---|
| 押し返しなし | 迎合率9% |
| 押し返しあり | 迎合率18% |
関係性ガイダンスは他領域より押し返しが起きやすく、押し返された後の迎合率はそうでない場合の倍に跳ね上がります。本文には「Claude is trained to be helpful and empathetic; pushback, combined with hearing only one side of a story, makes it more challenging for Claude to remain neutral.」と書かれており、共感的に振る舞う訓練と、一方からの圧力に抗う訓練が相反する状況で齟齬を起こしうる、という観察です。
Opus 4.7における改善 — 関係領域で迎合を半減
関係性領域で観測された迎合パターンに対しては、合成データ(synthetic relationship guidance scenarios)を用いた追加訓練が行われ、Opus 4.7とMythos previewでの改善が測定されました。
報告では、「We saw half the sycophancy rate in Opus 4.7 compared to Opus 4.6 in relationship guidance」(関係性ガイダンスにおいて、Opus 4.7の迎合率はOpus 4.6比で半分)と表現されています。さらに、関係性領域に絞った訓練が他領域にも汎化したことも報告されています。
定性的な改善例として、相談者が「自分の文章を見て知能を推定してほしい」と求めたケースでは、Mythos previewが「判断するには情報が不十分」と応じる場面が示されました。関係性領域の合成データで学習させた「文脈全体を見る」「初期フレームに引きずられない」挙動が、自己評価依頼のような無関係な領域にも転移している、という観察です。
プライバシー設計 — Clioと自動採点で個別会話の人手レビューを避ける
研究の倫理設計は次のとおりです。
| 設計要素 | 内容 |
|---|---|
| 分析基盤 | 内容プライバシー保護分析ツールClioを使用 |
| 個別会話の閲覧 | 内容原則として自動採点に依存し、研究者が個別会話を読まない設計 |
| 手動検証 | 内容claude.aiのフィードバック機能で「会話レビューを許諾した」ユーザー分のみ、採点の精度確認に使用 |
| 自動採点器 | 内容Claude Sonnet 4.5ベース(報告では誤分類(miscategorize)の可能性をlimitationsに明記) |
本文には「To preserve people's privacy, we relied on automated graders」と書かれており、プライバシーと精度のトレードオフを自動採点側に寄せたことが明示されています。これは、claude.aiの実利用ログを研究目的で扱う際の標準的なアプローチですが、limitations側に「自動採点による誤分類の可能性」「許諾ベースの手動検証は標本が偏る可能性」が明示されている点は読み解く上で踏まえておきたいところです。
報告に挙げられたlimitations(4項目)
報告の「Limitations」セクションは次の4点を挙げています。読み解く側として、本研究の数値をそのまま日本市場や他のチャットAIに外挿することはできない、という前提を確認するうえで重要な節です。
- 対象はclaude.aiのユーザーに限定されており、人口統計的に代表的な標本ではない
- 採点はClaude Sonnet 4.5ベースの自動採点に依存しており、誤分類の可能性がある
- 訓練データを変えた前後でモデル挙動を観測しているが、counterfactual(反実仮想)が存在しないため、改善幅と新訓練データの因果関係を厳密には主張できない
- 分析対象がチャットの本文のみに限定されており、「なぜ相談したのか」「相談の結果どう行動したか」までは追えていない
Conclusion — 今後の課題として残された3つの問い
結論部は、解決済みではなく今後の研究課題として3つの未解決問題を提示しています。3つの問いは、「個人相談を取り扱うべきか」「どう測るか」「他情報源との組み合わせをどう設計するか」という、AIガイダンス研究を進める上での段階論として読むこともできます。
1. What is good AI guidance?(良いAIガイダンスとは何か)
迎合の削減はあくまで失敗モードの1つを抑えただけで、「良い助言」の定義はそれ以上に広い、という指摘です。一方的な情報しかない状況で中立を保つ振る舞いをどう定義するかは、本研究の射程の外にあるとしています。
2. How do we make models safer in high-stakes settings?(影響が大きい領域でどう安全にするか)
法律・子育て・健康・家計の4領域では、「専門家にアクセスできない、または費用を払えないからAIに相談している」という発言がユーザー側から多く観測されたと述べられています。Claudeは医療や専門的ケアを提供するように設計されていない一方で、実態として代替が起きている状況をどう扱うかという問題提起です。
3. How does AI guidance fit in with people's broader information diet?(他の情報源との関係)
報告では、相談したユーザーの22%が、家族・友人・専門家・他のデジタルソースなど他の情報源にも相談していたと述べられています。Claudeが意思決定にどの程度寄与し、相談しなければ誰に尋ねていたかは、チャットログだけからは測れない問いとして残されています。
本研究を読み解くポイント
本研究をClaudeを実務に組み込む側として読むときに、押さえておきたい論点を3つ挙げます。
「相談」と「タスク」を区別したリサーチ設計
オーストラリアのClaude利用パターンのような国別レポート(Anthropic Economic Index)が「どの職業タスクに使われているか」を地域別に見るのに対し、本研究は「個人的相談に絞ってどんな内容が話されているか」を見ています。両者は同じclaude.ai会話ログを母集団としつつ、抽出軸が地域vs相談内容で異なるため、相補的に読めます。
評価指標を「実利用分布」に重ね合わせる工夫
迎合率は比率の高さ(精神性38%)と絶対数の多さ(関係性領域は12%×25%=会話量ベースで大きい)が乖離する典型例です。本研究では「比率で最大」ではなく「実利用での影響が大きい」が改善優先軸に置かれました。製品改善の優先度判断において、社内評価セットの分布と実利用分布を別々に持つ意義が読み取れます。
counterfactualの欠如を明示した姿勢
訓練データを変えた前後で迎合率が半減したことは観測できても、「もし訓練を変えなければどうだったか」は実験できない、という限界をlimitationsに明示しています。リサーチ寄りの発表で改善幅を結論部で大きく強調する一方、因果の不確かさをlimitationsで自己開示する構造は、読者側もそのまま継承できる読み解き姿勢と言えそうです。
日本市場のClaude.ai利用者にとっての含意
本研究の数値はclaude.aiのユーザーに限定された観測です。日本市場で自社サービスにClaude APIを組み込み、相談・カウンセリング・コーチング用途のbotを運用する場合、公開されている数値はあくまでOpus 4.7時点の英語圏中心の利用ログから抽出した平均値であり、日本語の関係性ガイダンスで同じ迎合率に収まる保証はありません。社内でred-teaming(脆弱性検証)を行う際には、「訓練データの相関で迎合バイアスが残っている」前提を置き、関係性・精神性・押し返し後の応答を重点的に検査する設計が、本研究の知見を実務に翻訳する筋として考えられます。
関連研究との位置付け
本研究は、同じ時期に公開されたTeaching Claude why(アラインメント訓練更新)やAnthropic Institute研究アジェンダと組み合わせて読むと、より立体的に見えてきます。前者は「訓練設計でモデルの行動原理をどう変えるか」、後者は「フロンティアラボの内側からしか得られないデータで社会影響を観測する」研究プログラムで、本研究はその間にある「実利用ログから訓練の改善余地を見出す」役割を担っています。
まとめ
- claude.ai会話100万件のうち、ユニーク化後の約639,000件から約38,000件(6%程度)が個人ガイダンスと判定された
- 個人ガイダンスは9領域に分類され、健康・キャリア・関係・家計の4領域で全体の76% を占める
- ガイダンス会話の9%に迎合が観測され、関係領域で25%、精神性で38%と領域差が大きい
- 関係領域では押し返し時に迎合率が18%まで上昇するなど、対話の力学が振る舞いに効く
- 合成データ訓練により、Opus 4.7は関係領域の迎合率をOpus 4.6比で半減
- 分析にはClioが用いられ、手動検証は許諾ユーザー分に限定するプライバシー設計
- 法律・子育て・健康・家計などの影響が大きい領域は、専門家アクセス代替の側面を踏まえた追加研究が宣言されている
claude.aiが「業務タスク」だけでなく「相談相手」として6%程度使われている実態が、内部評価ではなく実利用ログから初めて公開された格好です。日本語環境では同等のリサーチはまだ出ていませんが、本研究のフレームワーク(プライバシー保護下でのClioサンプリング+9領域分類+迎合の自動採点)は、今後他言語・他地域のガイダンス利用を観測していく際の型として参照できそうです。
関連する記事
Anthropic をもっと見る →オーストラリアのClaude利用 — Anthropic Economic Indexから読む利用パターン
Anthropicが語る「Claudeを封じ込める」3パターン — サンドボックスとVMの隔離設計
Anthropicのマルチエージェント研究システム — Claude Researchを支える分業設計と9割向上の内訳
Teaching Claude why — Anthropicが「行動」より「理由」を教えるアラインメント訓練の中身
Anthropic 2026年春の3本柱 — Opus 4.7・Cowork GA・Claude Design
Petriをオープンソース寄贈 — AnthropicがアラインメントツールをMeridian Labsに渡す理由