Stanford AI Index 2026が示す現実——採用率88%・透明性スコア急落・中国が猛追

なぜ Stanford AI Index を読むべきか

毎年Stanford HAI（Human-Centered AI）が公開するAI Indexレポートは、AI分野における最も信頼性の高い包括的調査の一つだ。2026年版は2025年のデータをベースに、モデル性能・企業採用・地政学・社会影響を横断的に分析している。

開発者・ビルダーにとって「業界の今」を客観的に把握するための出発点になる。

1. AI能力：「人間レベル」到達の加速

ベンチマークで見る進化

SWE-bench Verified（実際のGitHub Issueを解決するタスク）:
  2024年: ~60%
  2025年: ~100%
  → 1年で40ポイント向上

PhD科学問題（GPQA Diamond）:
  人間の専門家平均: ~70%
  主要LLM 2025年末: 70%超
  → 専門家レベルに並ぶ

競技数学（AIME等）:
  上位モデルが金メダリストレベルを達成

ただし注意：ベンチマーク性能が実業務での有用性と直結するわけではない。「ベンチマーク汚染」（訓練データへのテストデータ混入）の問題は現在も議論中だ。

業界製モデルが支配的

注目すべきは2025年の注目フロンティアモデルの90%以上が企業製という点だ。学術機関によるフロンティアモデル開発はほぼ消滅しつつある。

フロンティアモデルの開発元比率（2025年）:
  企業（商用）: > 90%
  学術・非営利:  < 10%

2. 企業・社会への普及

組織採用率88%

AI組織採用率の推移:
  2023年: ~50%台
  2024年: ~72%
  2025年: 88%

用途別（上位）:
  1. ソフトウェア開発支援
  2. カスタマーサポート
  3. データ分析・レポーティング
  4. コンテンツ生成

大学生・若年層での浸透

大学生の4人に1人以上がGenAIを日常的に使用
K-12（小中高）でAIを学業に使う生徒：50〜84%
米国大学: 約90%、英国大学: 約95%がGenAIを利用

消費者余剰：$1,720億

米国消費者がGenAIツールから得る推定余剰価値は年間1,720億ドル（2026年初時点）。2025年の1,120億ドルから1年で54%増加した。

3. 地政学：中国の急追と人材流出

性能差が急縮小

AIモデル性能ランキングの変化:
  2023年: 米国モデルが中国を大幅リード
  2025年: 中国トップモデルが米国トップモデルに"ほぼ並ぶ"

中国の強み:
  - AI関連特許数: 世界1位
  - AI関連論文数: 世界1位
  - 工場自動化ロボット展開台数: 世界1位

米国の強みと弱点

米国の強み:
  民間AI投資（2025年）: $2,859億（中国の$124億の23倍）
  トップAI企業の集中度: 引き続き米国優位

深刻な弱点:
  AI研究者の米国流入数: 2017年比89%減
  ここ1年の流入減速: 80%加速
  → 「頭脳流入」が「頭脳流出」に転じる兆候

4. 透明性：最大の懸念

Foundation Model Transparency Index 急落

FMTIスコア（主要AIモデルの透明性評価）:
  2024年: 平均 58点 / 100点
  2025年: 平均 40点 / 100点
  → 1年で 18点（31%）低下

測定対象は「訓練データの開示」「計算コスト」「リスク評価の公開」「利用ポリシーの透明性」など。

能力が向上するほど競合優位が高まり、透明性を開示するインセンティブが低下するというトレードオフが顕在化している。

開発者が注目すべき点

注目すべき3点:

1. SWE-bench ~100% 到達
   → コーディングアシスタントを「補助」から「実装担当」に昇格させる
     ワークフロー再設計を検討する時期

2. 透明性スコア急落
   → 使用しているモデルの訓練データ・リスク評価が
     非公開のブラックボックスになっていることを前提に運用設計する

3. AI研究者流入の激減
   → 5〜10年後の人材供給リスクが高まっている
     社内AI人材育成の重要性が上がる

注意点

データの大部分は2025年のもので、2026年4月現在の最新状況は反映されていない可能性がある
ベンチマーク性能と実業務での有用性は必ずしも一致しない
「透明性スコア」の測定方法自体も議論の余地がある

まとめ

AIは「ハイプ」の段階を過ぎて「インフラ」として定着しつつある。同時に、透明性の低下とAI人材確保競争の激化は、長期的な持続性に疑問符をつける。開発者としてはツールの恩恵を享受しながら、ブラックボックスへの依存リスクを意識的に管理することが求められる。

S	公式ソース確認済み
A	成功実績多数・失敗例少数
B	賛否両論
C	動作未確認・セキュリティリスク高
Z	個人所感