SJ blog
ai
A

信頼度ランク

S 公式ソース確認済み
A 成功実績多数・失敗例少数
B 賛否両論
C 動作未確認・セキュリティリスク高
Z 個人所感

Ineffable Intelligence——AlphaGo設計者が欧州史上最大$1.1Bを調達、「人間データ不要」強化学習スーパーラーナーが目指す次のフロンティア

2026年4月27日、DeepMind元RL主任David SilverのIneffable Intelligenceが欧州史上最大$1.1Bシード(評価額$5.1B)を調達。強化学習で人間データなしに新知識を発見する「スーパーラーナー」の構想と開発者・研究者への意味を解説。

一言結論

AlphaGo/AlphaZero設計者David SilverがDeepMindを離れ、強化学習単独で人間データなしに新知識を発見するスーパーラーナーを構築するIneffable Intelligenceを創業。欧州史上最大$1.1Bシード($5.1B評価)をSequoia・Lightspeed・NVIDIA・Google・英国Sovereign AI Fundから調達した。現行LLMの「人間データスケーリングボトルネック」を根本から回避するアプローチで、次世代AI研究の方向性を示している。

何が起きたか

2026年4月27日、英国ロンドンを拠点とするAIスタートアップIneffable Intelligenceがステルスを解除し、$1.1Bシードラウンド(評価額$5.1B)の調達を発表した。これは欧州のスタートアップ史上最大のシードラウンドとなる。

創業者はDeepMindで10年以上にわたって強化学習チームを率いたDavid Silver。AlphaGo・AlphaZeroの設計者として知られ、コンピュータが人間データなしにチェスや囲碁で超人的強さを獲得したことを証明した人物だ。


Ineffable Intelligenceが目指すもの

Ineffable Intelligenceは「スーパーラーナー(superlearner)」の構築を目標に掲げる。

既存のLLMアプローチ
人間が生成したテキスト・コード・データ
→ 巨大なコーパスで事前学習
→ RLHFで人間の好みに合わせる
⚠️ 限界: 人間データのスケーリング上限に近づきつつある

Ineffableのアプローチ(スーパーラーナー)
環境との試行錯誤(RL)
→ 人間データなしで知識・スキルを発見
→ 科学・技術・社会・経済の新原理を自律的に探索
✅ 人間データ依存のスケーリングボトルネックを原理的に回避

AlphaZeroはチェスのルールだけを与えられ、人間の棋譜なしに世界最強の棋力を獲得した。Ineffableはこの「経験からの学習」を汎用的な知識発見に拡張しようとしている。


資金調達の詳細

項目詳細
ラウンドシードラウンド
調達額$1.1B(欧州史上最大シード)
評価額$5.1B
発表日2026年4月27日
拠点ロンドン、英国
リード投資家Sequoia Capital・Lightspeed Venture Partners
参加投資家NVIDIA・Google・Index Ventures・DST Global・英国 Sovereign AI Fund

英国政府(UK Sovereign AI Fund)が直接出資している点が異例で、英国がAI研究の国家戦略的資産として位置づけていることを示す。


David Silver のバックグラウンド

主要業績(DeepMind時代)
├─ AlphaGo(2016): 囲碁でLee Sedolを破った最初のAI
├─ AlphaGo Zero(2017): 人間の棋譜なしで最強棋力を獲得
├─ AlphaZero(2017): チェス・将棋・囲碁を単一モデルで制覇
└─ MuZero(2020): ルールの事前知識なしに学習

教育歴: UCL(ロンドン大学)教授職も兼務
専門: 強化学習理論・深層強化学習・モデルベースRL

AlphaGo Zeroで示した「人間データなし超人学習」の原理が、Ineffableの中核仮説に直結している。


開発者・研究者への実際の影響

近中期(1〜3年)

スーパーラーナーが直接プロダクトとして提供される段階ではないが、研究成果は次の形で波及する可能性が高い:

期待される波及効果

1. コード生成エージェントの自律改善
   現在: 人間が書いたコードを学習
   将来: テスト実行フィードバックのみで自律的にコーディング戦略を改善

2. 科学計算・最適化
   タンパク質設計・材料探索・数学定理証明での試行錯誤加速

3. RLベースのプランニングエージェント
   長期タスクで「試行→失敗→改善」サイクルが現行LLMより効率的

研究文脈でのポジション

現在の主要RLアプローチと比較

DeepMind AlphaGo系 → ゲーム特化・閉じた環境
OpenAI o1/o3 推論強化 → LLM上でのテスト時計算量増加
Anthropic Constitution AI → 人間フィードバック品質改善

Ineffable(想定) → 完全に人間データなし・開放環境
                   → 未知の問題への汎化が鍵

注意点・未確認事項

  • 技術詳細は非公開: Ineffableはステルス解除直後で、アーキテクチャや具体的な手法は一切公開されていない。「スーパーラーナー」の定義も現時点では概念レベル。
  • タイムラインは未示: 製品・API・研究論文の公開時期は発表されていない。
  • 評価額$5.1B: 実証なしのシードラウンドとして異例の高評価。市場のAI期待値の高さを反映しているが、過大評価リスクも存在する。
  • RLスケーリングの難しさ: 閉じたゲーム環境と開放的な知識発見では難易度が桁違いに異なる。AlphaZeroの成功が汎用化できるかは未検証。

参考リンク

注記: 技術的な詳細・製品ロードマップ・研究論文は本稿執筆時点(2026-05-04)で未公開。Ineffable Intelligence公式サイトおよびSequoiaのブログで最新情報を確認すること。