SJ blog
ai
A

信頼度ランク

S 公式ソース確認済み
A 成功実績多数・失敗例少数
B 賛否両論
C 動作未確認・セキュリティリスク高
Z 個人所感

Google Cloud Next 2026の核心——Ironwood TPU正式GA・Gemini Enterprise Agent Platformで「推論の時代」が始まる

4月22〜23日開催のGoogle Cloud Next 2026。第7世代TPU「Ironwood」の一般提供開始、Gemini Enterprise Agent Platform発表、第8世代TPUプレビューを開発者視点で解説。

一言結論

Google Cloud Next 2026ではIronwood TPU(第7世代)がGAになり推論4.6 PFLOPS/chipを実現、Vertex AIを刷新したGemini Enterprise Agent PlatformがAIエージェントの構築・統治基盤となった。開発者にとって最大の変化は「クラウドでエージェントを動かすコスト構造が根本から変わる」ことだ。

背景:なぜ2026年のCloud Nextが特別なのか

Google Cloud Next 2026は4月22〜23日にラスベガスで開催された。例年はモデルの発表が目玉になりがちだが、今回はインフラとプラットフォームが主役だった。Gemini 4はGoogle I/O 2026(5月)まで温存されており、その代わりに「エージェントを動かすための土台」が大量に整備された。

開発者にとって重要なのは以下の3点だ:

Cloud Next 2026 開発者への3大インパクト:

  1. Ironwood TPU → クラウドでの推論コストが根本から下がる
  2. Gemini Enterprise Agent Platform → AIエージェントの「管理」が初めて体系化される
  3. $750Mパートナーファンド → Googleが自腹でエージェント普及を加速する

Ironwood TPU:「推論の時代」の幕開け

第7世代TPUが一般提供(GA)開始

Google Cloud Next 2026の最大の発表のひとつは、Ironwood TPU(第7世代)の一般提供開始だ。

Ironwoodは「推論の時代のための最初のTPU」と位置づけられている。過去のTPUが学習中心に設計されていたのに対し、Ironwoodは高ボリューム・低レイテンシの推論ワークロードを主眼に設計されたチップだ。

Ironwood TPU スペック概要:

  チップ単体性能:  4.6 ペタFLOPS(前世代比 4倍以上)
  スーパーポッド:  9,216チップ = 42.5 エクサFLOPS
  用途最適化:    高スループット・低レイテンシの推論/モデルサービング
  ソフトウェア:  Pathways スタック(数万チップを透過的に管理)
  GA時期:       2026年4月22日(Cloud Next 2026)

前世代(第6世代 Trillium)比で 4倍以上の性能向上 を実現し、エネルギー効率も大幅に改善している。

なぜ「推論の時代」なのか

LLMの利用形態が変わってきた。GPT-4が登場した2023年は「モデルを学習させること」が主な関心事だったが、2026年現在は推論(inference)がGPUコストの大半を占める

AIエージェントが常駐してリアルタイムで判断し続けるユースケースでは、推論レイテンシとスループットが直接ビジネス価値に直結する。Ironwoodはこの変化に正面から応答したチップだ。

推論コスト構造の変化(概算):

  2023年: 学習70% / 推論30%
  2026年: 学習30% / 推論70%  ←─ AIエージェント時代の現実

  エージェントが1日100万回推論するなら、
  4倍の推論効率 = コスト1/4 or 同じコストで4倍のスループット

GoogleはTPU出荷台数を2026年430万枚、2027年1,000万枚、2028年3,500万枚超と予測している。この規模感は、Nvidiaとの本格競争が始まったことを意味する。

第8世代TPUのプレビュー(2027年以降)

Cloud Next 2026では第8世代TPUもプレビューされた。詳細は以下の通り:

第8世代TPU プレビュー情報(2026年4月時点):

  TPU 8t(Sunfish):
    役割: 学習特化
    設計: Broadcom設計
    目標: フロンティアモデル開発サイクルを「月→週」に短縮
    規模: 1スーパーポッド = 9,600チップ / 2ペタバイト共有HBM
    
  TPU 8i(Zebrafish):
    役割: 推論特化
    設計: MediaTek設計
    規模: 1ポッド = 1,152チップ
    SRAM: オンチップ384MB(3倍増)、HBM 288GB
    KVキャッシュをシリコン上に全量格納可能

  製造プロセス: TSMC 2nm(予定)
  提供時期: 2027年以降(未確定)

第8世代はまだプレビューであり、仕様・価格・提供時期はすべて変更の可能性がある。


Gemini Enterprise Agent Platform:Vertex AIの大改革

何が変わったのか

Cloud Next 2026で最も長期的な影響を持つ発表は、Gemini Enterprise Agent Platform(旧 Vertex AI の大規模再構築)だ。

TechCrunchが「Googleが企業向けエージェント構築ツールで面白い選択をした」と評した通り、これは単なるUI刷新ではない。Vertex AIのすべてのサービスとロードマップが、今後この新プラットフォームを通じてのみ提供される。

Gemini Enterprise Agent Platform の主要コンポーネント:

  構築(Build):
    - Agent Development Kit(ADK)強化 → サブエージェントネットワーク対応
    - Agent Designer → ノーコードでエージェントを組み立てるUI
    - Workspaces → bash/ファイル操作の安全なサンドボックス環境

  スケール(Scale):
    - バッチ&イベント駆動エージェント → BigQuery・Pub/Sub連携
    - プラグ&プレイのエコシステム統合

  統治(Govern):
    - Agent Identity → 各エージェントに追跡可能なアイデンティティを付与
    - Agent Registry → 組織内エージェントの一元管理
    - Agent Gateway → エンタープライズグレードのガードレール
    - Agent Inbox → エージェント活動の一元把握

  最適化(Optimize):
    - Vertex GenAI Evaluation Service → エージェント評価対応

対応モデルと Model Garden

特筆すべきは、Gemini以外のモデルも正式サポートされていることだ:

Gemini Enterprise Agent Platform 対応モデル:

  Google モデル:
    - Gemini 3.1 Pro
    - Gemini 3.1 Flash Image(Nano Banana 2)
    - Lyria 3(音楽生成)
    - Gemma 4(オープンモデル)

  Anthropic モデル(Model Garden経由):
    - Claude Opus 4.7
    - Claude Sonnet
    - Claude Haiku

  その他: 合計200以上のモデルを Model Garden から利用可能

AWSのBedrock、Azureの AI Studioと同様に、Googleも「マルチモデルの選択肢」を提供するプラットフォームとして競合している。

ADKを使ったエージェント構築の例

# Google Agent Development Kit (ADK) を使った
# サブエージェントネットワークの構成例

from google.adk import Agent, SubAgent, AgentSession

# 専門サブエージェントを定義
research_agent = SubAgent(
    name="researcher",
    model="gemini-3.1-pro",
    tools=["google_search", "vertex_rag"],
    system_prompt="Webと社内ドキュメントを検索して情報を収集する"
)

code_agent = SubAgent(
    name="coder", 
    model="claude-sonnet",  # Anthropicモデルも混在可能
    tools=["code_interpreter", "github"],
    system_prompt="Pythonコードを生成・実行・デバッグする"
)

# オーケストレーターエージェント
orchestrator = Agent(
    name="main_agent",
    model="gemini-3.1-pro",
    sub_agents=[research_agent, code_agent],
    workspace="sandboxed",  # bash/ファイル操作を安全なサンドボックスで実行
)

# セッション管理(Agent Inbox経由で監視可能)
session = AgentSession(
    agent=orchestrator,
    agent_identity="prod-report-bot-v1",  # Agent Identityで追跡
    max_turns=50,
)

result = await session.run(
    "Q1 2026の売上レポートを作成してGitHubにコミットして"
)

$750Mパートナーファンドと開発者への波及

GoogleはCloud Partnerエコシステム(12万組織)向けに7億5,000万ドルのファンドを設置した。内訳は、Gemini PoC費用・Googleエンジニアの前線支援・クラウドクレジット・デプロイリベートなどだ。

スタートアップの視点からは、これがAIエージェントのコモディティ化を加速する。GoogleがパートナーのAIエージェント開発コストを肩代わりすることで、大企業がAIエージェント導入の実証実験をより低リスクで行えるようになる。


落とし穴と注意点

今回の発表で注意すべき点:

  ⚠️  Gemini 4は発表されなかった
      → Google I/O 2026(5月)まで待つ必要がある

  ⚠️  第8世代TPU(Sunfish/Zebrafish)はプレビューのみ
      → 仕様・価格・提供時期はすべて暫定、2027年以降

  ⚠️  Gemini Enterprise Agent Platformの価格体系はGA前と変わる可能性がある
      → 現在は新規顧客に$300クレジット提供中

  ⚠️  Vertex AIのブランドはAgent Platformに統合される
      → 既存のVertex AI APIは引き続き動くが、
        新機能は新プラットフォームでのみ提供される

  ⚠️  Agent Identity/Registryはまだ設計段階の機能も含む
      → エンタープライズ統治機能のGA時期は要確認

まとめ

Google Cloud Next 2026の本質は「AIエージェントを本番運用するための土台を整備した」ことだ。

  • Ironwood TPU のGA → 推論コストが下がり、エージェントの常駐コストが現実的になる
  • Gemini Enterprise Agent Platform → 「作る・動かす・管理する」が一体化した初の本格的エージェント基盤
  • マルチモデル対応 → Anthropic Claude等も含む200以上のモデルが選べる
  • $750Mパートナーファンド → エコシステム全体への実質的なAIエージェント導入補助

2026年のAIインフラ競争はAzure・AWS・Googleの三つ巴で進行しているが、今回のCloud Nextでは「推論に特化したシリコン」と「エージェント統治プラットフォーム」という2軸でGoogleが先手を打った形だ。

参考リンク