Anthropic調査:社会科学者のコーディングエージェント常用率は20%、ワーキングペーパーは75%増

Anthropicは2026年5月27日、量的社会科学者1,260人を対象にコーディングエージェントの利用実態を調べた研究「Coding agents in the social sciences」を公開しました。調査はThomas Lyttelton氏、Maxim Massenkoff氏、Nathan Wilmers氏の3名が主導し、AIチャットボットの利用が81%まで広がる一方でClaude CodeやCodexのようなコーディングエージェントを常用するのは20%にとどまることや、その20%のあいだで男性・若手・上位校への偏りが大きいことを示しました。

要点

回答者は経済学・政治学・社会学などの量的社会科学者1,260人で、2026年2月末から3月にかけて実施
81%が研究にAIチャットボットを使った経験あり、ただし週1回以上コーディングエージェントを使うのは20%
コーディングエージェント利用者の86%がClaude Code、31%がCodexを併用
男性は女性の2倍以上の利用率、博士課程・ポスドク層はテニュア教員の倍以上
上位25校の研究者は40%高い利用率、経済学者は39%、公衆衛生は6%とディシプリン格差も大きい
利用者は半年で空きプロジェクトを10%多く開始し、ワーキングペーパー投稿数は75%多い一方、ジャーナル投稿には有意差なし

全体としては「コーディングエージェントは社会科学に入りつつあるが、入り口で既に格差が出ている」「成果は研究の上流(着手・ワーキングペーパー)で先に現れ、ジャーナル査読の下流にはまだ届いていない」という構図が読み取れます。同じチームは半年後の2026年6月に、対象を約40万件のClaude Codeセッションへ広げた大規模分析「Claude Code 40万セッション分析」を公開しており、成功率を左右するのは職業ではなく分野の専門性という結論に至っています。

調査の枠組み:Claude Maxアカウント募集と紐づく自己選択サンプル

調査対象はメール経由でClaude Maxアカウントの提供と引き換えに参加を募った量的社会科学者です。代表性のあるランダムサンプルではなく、「AIに関心が強い層が自己選択した母集団」であることをAnthropic自身が冒頭で明示しています。生のAI受容度はやや高めに出る前提で読み解く必要があります。

ディシプリンの内訳は経済学・政治学・社会学がそれぞれ約20%、経営科学と心理学がそれに続き、公衆衛生・教育・コミュニケーションは少数です。キャリアステージは正教授・准教授で40%、助教で25%、博士課程で30%と幅広い層をカバーしています。集計時の統制変数はキャリアステージ・ディシプリン・回答週で、報告された全てのグループ差は p < 0.05 で有意とされています。

利用ツールについては、コーディングエージェント利用者の86%がClaude Code、31%がCodexを挙げ、CursorやGoogle Antigravityもそれに続きます。社会科学者のAIワークフローに関する初の体系的な実態調査として、研究の上流に置く価値があるベースラインです。

利用率の格差:ジェンダー・キャリア・所属の3軸

AIチャットボット全体の利用は研究現場に深く浸透しています。回答者の81%が論文・データ分析・コード生成のいずれかでAIモデルを使った経験があり、AIに触れたことがない研究者は2割を切ります。一方、コマンドラインに統合されたコーディングエージェント(Codex、Cursor、Claude Code)を週1回以上常用するのは20%です。

格差はその20%のあいだで強く出ています。男性の利用率は女性の2倍以上、博士課程とポスドク層では25%超が常用しているのに対しテニュアを持つ教授層は半分以下、Nature Index基準で上位25校に所属する研究者は他の研究者より40%高い利用率を示しました。ディシプリン別では経済学が39%でトップ、政治学が25%、対して公衆衛生は6%、教育は4%、コミュニケーションは6%にとどまります。

利用率格差の早見表

軸	高利用層	低利用層	ギャップの読み筋
ジェンダー	高利用層男性	低利用層女性	ギャップの読み筋男性が女性の2倍以上
キャリアステージ	高利用層博士・ポスドク(25%超)	低利用層テニュア教授(半分以下)	ギャップの読み筋若手ほど早期採用
所属機関	高利用層Nature Index上位25校	低利用層それ以外	ギャップの読み筋上位校が40%高い
ディシプリン	高利用層経済学39% / 政治学25%	低利用層公衆衛生6% / 教育4%	ギャップの読み筋計算リテラシーの差

これらの格差は、AIツールの先端的な恩恵が研究資源の厚いところに集中する構図と整合的です。

使い方の中身:97%がコード生成、文章生成は3分の1

利用パターンにも明確な偏りがあります。コーディングエージェント利用者の97%はAIをコード生成に使い、それ以外のAI利用者でもコード生成は77%に達します。一方、AIで散文(プロセ)を起草する用途に使った経験があるのはAI利用者全体の3分の1にとどまり、「研究文書の本文をAIに書かせる」ことには依然として強い抵抗があることが分かります。

頻出ユースケースとして挙がるのは、コード生成・既存文章の編集・統計手法のアドバイス・背景リサーチです。コーディングエージェント利用者は単発のチャットでコードスニペットを受け取るのではなく、データクリーニングや回帰モデルの実装をエージェントに任せて研究パイプラインの一部として動かしているとみられます。

AIの用途構成

用途	コーディングエージェント利用者	それ以外のAI利用者
コード生成	コーディングエージェント利用者97%	それ以外のAI利用者77%
文章の編集	コーディングエージェント利用者上位	それ以外のAI利用者上位
統計手法のアドバイス	コーディングエージェント利用者上位	それ以外のAI利用者上位
散文の起草	コーディングエージェント利用者3分の1規模	それ以外のAI利用者3分の1規模

「コーディングが一番AIに移譲しやすく、文章生成は依然として研究者の手元に残っている」という配分が、社会科学のワークフローにおけるAI境界線の現在地と読めます。

生産性のシグナル:上流で先行、ジャーナル下流はまだ動かない

半年間のアウトプットを比較すると、コーディングエージェント利用者は非利用者と比べて経験的プロジェクトを10%多く開始し、ワーキングペーパーの公開数は75%多いという結果になりました。研究者1人あたりに換算すると、新規着手は0.25本、ワーキングペーパー投稿は0.5本ぶん多く積み上がっています。

一方、ジャーナル投稿数と再投稿数には統計的に有意な差は見られませんでした。査読プロセスを通過するには数ヶ月から年単位の時間が必要で、半年スパンの調査では下流まで届かないという解釈が自然です。利用者は2026年に入ってからツールに本格的に触れた層が多いため、ジャーナル成果への影響は今後のフォローアップ調査で明らかになると考えられます。

半年間の生産性指標

指標	コーディングエージェント利用者vs非利用者
経験的プロジェクトの開始	コーディングエージェント利用者vs非利用者10%多い(約0.25本/人)
ワーキングペーパーの公開	コーディングエージェント利用者vs非利用者75%多い(約0.5本/人)
ジャーナル投稿	コーディングエージェント利用者vs非利用者有意差なし
ジャーナル再投稿	コーディングエージェント利用者vs非利用者有意差なし

研究者本人の主観評価も極めて高く、AIが論文生産性に与える影響を10点満点で評価する設問で、88%が5点超を選び、50%が8点以上を付けています。ただし「自分の論文生産性への影響」(楽観)と「社会科学の分野全体への影響」(やや控えめ)で70%が前者を上回ったと回答しており、個人レベルの恩恵と分野全体の懸念のあいだに認識のギャップがある点が浮かびます。

編集視点:Economic Indexの実態調査とどう違うのか

このレポートは、AnthropicのEconomic Indexが進めてきた経済全体のAI利用実態調査と方向は同じですが、対象を「研究者というプロフェッショナル」に絞り、なおかつチャットボットとコーディングエージェントを分けて測ったことに新規性があります。同社が2026年4月に公開したClaudeユーザー8万人の自由記述調査は労働者全体のAI受容と生産性の主観評価を扱いましたが、今回の研究は学術というドメインに限ってより細粒度の格差を可視化しました。

注目したいのは「コーディングエージェント」と「AIチャットボット」を別の段階の現象として扱った点です。チャットボット利用率81%はすでに普及曲線の踊り場に近づいているのに対し、コーディングエージェント利用率20%はまだ初期採用フェーズに見えます。そして初期採用フェーズだからこそ、ジェンダー・キャリア・所属の3軸で利用率の差が顕著に出ています。利用率が普及曲線の右側に動くにつれて、研究資源の格差を増幅するか、それとも縮小に向かうかは、今後の追跡で見える可能性が高い論点です。

社会科学者のワークフローにおけるAIの境界線も興味深く読めます。コード生成は97%が任せられる一方で散文起草は3分の1にとどまるという配分は、「定型化しやすい計算タスクから自動化が進み、解釈と物語化は人間が握る」というAnthropic自社エンジニア132人の生産性調査が示した役割移行と、社会科学でも同じ方向に動いていると読めます。

Economic Index Surveyの月次運用開始が予告された月次パネルや、本研究で予告されているランダム化実験が走ると、選択効果と因果効果を切り分けたうえで「コーディングエージェントが本当にジャーナル下流まで届くか」を測れるようになる見込みです。半年でワーキングペーパー75%増という上流シグナルが、1〜2年後にジャーナル本数で確認できるかが次の見どころです。

想定される影響:研究の地形が変わるシナリオ

著者らはコーディングエージェントが社会科学を「チャットボットよりも根本的に再構成しうる」と述べています。コードを書くことが研究の中核作業の一つである量的社会科学では、データクリーニング・前処理・推定・可視化の各工程をエージェントに任せられるようになると、研究1本あたりの限界コストが大きく下がる可能性があります。

同時に、3つの懸念も提示されています。第一に、研究資源の格差が拡大する可能性です。上位校と他の研究者で40%の利用率差が既にあるなか、コーディングエージェントの生産性ブーストが乗ると差はさらに広がりかねません。第二に、ワーキングペーパーが半年で75%増えるペースが続けば、論文プレプリント市場での「シグナル過多」が生じます。「The Paper Factory」のような懸念は社会科学の各分野でも現実化しうる論点です。第三に、エージェントが採る「特徴的な分析の選択」が、経済と社会の集合的な理解に影響する可能性も指摘されています。

コーディングエージェント拡大のシナリオ早見表

軸	楽観シナリオ	慎重に見るべきリスク
生産性	楽観シナリオ1本あたりの限界コストが下がり、検証研究が増える	慎重に見るべきリスク量が増えても質が伴わずシグナル過多に
格差	楽観シナリオツール標準化で利用率が下位機関に広がる	慎重に見るべきリスク上位校・男性・若手への偏在が拡大する
方法論	楽観シナリオコードの透明性が上がり再現性が向上する	慎重に見るべきリスクエージェント特有の分析パターンが過剰に普及する
ジャーナル下流	楽観シナリオ1〜2年でアウトプット増が査読論文に反映される	慎重に見るべきリスク査読容量がボトルネックで滞留する

著者らは「個人の生産性ゲインと分野全体への懸念のあいだのテンション」を本研究の中心的な発見として位置付けています。「自分にとってはAIが効くが、分野全体には心配がある」と感じる構図は、AIと専門職労働のあいだに広く現れているシグナルと読めます。

調査の限界と今後の研究計画

Anthropic自身が明示している主な限界点は3つです。

自己選択バイアス:Claude Maxアカウント提供と引き換えにメール募集したため、AIに前向きな層が回答に偏っている可能性
半年スパン:ジャーナル査読は数ヶ月から年単位を要するため、下流の効果は今回の窓では捉えきれない
アウトプットの量と質の分離:ワーキングペーパー本数の増加は計測したものの、研究の質や厳密性は未評価

著者らは続報としてランダム化実験の結果を予定しており、選択効果と因果効果の切り分けを進めるとしています。アウトプットの量だけでなく内容の質を評価する研究も検討中で、本レポートが社会科学AI利用の「ベースライン版」になる可能性があります。

まとめ

Anthropicが量的社会科学者1,260人を対象にコーディングエージェントの利用実態を初めて体系的に調査しました
AIチャットボット利用率は81%、コーディングエージェントの常用率は20%で、入り口に明確な段差があります
利用者の86%がClaude Codeを使い、男性・若手・上位校・経済学に大きく偏ります
半年間でプロジェクト開始10%増、ワーキングペーパー75%増の上流シグナルが出る一方、ジャーナル投稿には有意差なし
著者らは個人の生産性ゲインと分野全体の懸念のテンションを論点として残しており、続報のランダム化実験で因果効果の検証が進む見込みです

研究機関の管理者や学術出版に関わる立場の方にとっては、「コーディングエージェントの導入支援を博士課程やポスドクに早期に届けるか」「ワーキングペーパーの増加に査読容量がどこまで追従できるか」を考えるベンチマークになります。一般のClaude Code利用者にとっても、量的研究という限定されたドメインで実際に何本のアウトプットが生まれているかを示す貴重な参照データです。

Anthropic調査:社会科学者のコーディングエージェント常用率は20%、ワーキングペーパーは75%増

要点

調査の枠組み:Claude Maxアカウント募集と紐づく自己選択サンプル

利用率の格差:ジェンダー・キャリア・所属の3軸

利用率格差の早見表

使い方の中身:97%がコード生成、文章生成は3分の1

AIの用途構成

生産性のシグナル:上流で先行、ジャーナル下流はまだ動かない

半年間の生産性指標

編集視点:Economic Indexの実態調査とどう違うのか

想定される影響:研究の地形が変わるシナリオ

コーディングエージェント拡大のシナリオ早見表

調査の限界と今後の研究計画

まとめ

Economic Index Cadences — 時間別Claude利用と当事者サーベイで労働観を測る

Claude Tagが登場 — Slackで@Claudeを呼び出しチームの一員として並行作業を任せる新形態

AnthropicがSeoulオフィスを開設 — 韓国政府MOUとNAVER・Samsung・LG採用まで一挙発表

AnthropicとTCSが規制産業向けに提携 — 56か国5万人展開とClaude Partner Network参画

AnthropicとDXCが規制産業向けに複数年提携 — 銀行・航空・保険の基幹システムにClaudeを組み込み

Claude Fable 5とMythos 5が登場 — Opus超えの新Mythosクラスが一般公開へ

要点

調査の枠組み:Claude Maxアカウント募集と紐づく自己選択サンプル

利用率の格差:ジェンダー・キャリア・所属の3軸

利用率格差の早見表

使い方の中身:97%がコード生成、文章生成は3分の1

AIの用途構成

生産性のシグナル:上流で先行、ジャーナル下流はまだ動かない

半年間の生産性指標

編集視点:Economic Indexの実態調査とどう違うのか

想定される影響:研究の地形が変わるシナリオ

コーディングエージェント拡大のシナリオ早見表

調査の限界と今後の研究計画

まとめ

関連する記事

Economic Index Cadences — 時間別Claude利用と当事者サーベイで労働観を測る

Claude Tagが登場 — Slackで@Claudeを呼び出しチームの一員として並行作業を任せる新形態

AnthropicがSeoulオフィスを開設 — 韓国政府MOUとNAVER・Samsung・LG採用まで一挙発表

AnthropicとTCSが規制産業向けに提携 — 56か国5万人展開とClaude Partner Network参画

AnthropicとDXCが規制産業向けに複数年提携 — 銀行・航空・保険の基幹システムにClaudeを組み込み

Claude Fable 5とMythos 5が登場 — Opus超えの新Mythosクラスが一般公開へ