GPT-5.5正式リリース——コードネームSpudは4月23日に公開、Terminal-Bench 82.7%・API $5/1Mトークンの実際

UPDATE (2026-04-24): 4月22日の記事「OpenAIの次世代モデル『Spud』が明日にも公開か」の続報です。予測通り翌日にGPT-5.5として正式リリースされました。本記事では確認された数字と開発者への実際の影響をまとめます。

何がリリースされたのか

2026年4月23日、OpenAIはGPT-5.5を正式公開した。コードネーム「Spud」として流出・推測されていたモデルが、GPT-5.5として確定した形だ。

GPT-5.5 リリース概要 (2026-04-23)
──────────────────────────────────────
ベースモデル : 完全再訓練（GPT-4.5以来初）
コンテキスト : 1,000,000トークン
公開対象     : Plus / Pro / Business / Enterprise（ChatGPT + Codex）
API          : 「近日公開」（価格は確定済み）
リスク分類   : OpenAI内部基準「High」（Criticalには非該当）

ベンチマーク：競合との差

OpenAIが公表した主要ベンチマーク結果：

ベンチマーク	GPT-5.5	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	69.4%	68.5%
GDPval	84.9%	未公表	未公表

Terminal-Bench 2.0はコマンドライン上での複雑なワークフロー（計画・反復・ツール連携）を評価するベンチマークで、エージェント的な使い方に近い。GPT-5.5はGPT-5.4比で7.6ポイント上回る82.7%を記録している。

また、OpenAIは「per-tokenのレイテンシはGPT-5.4と同等を維持しながら精度が向上した」と主張している。能力と速度の同時改善は珍しい。

API価格：倍になったが実コストは約20%増

API価格比較:
                  GPT-5.4       GPT-5.5       GPT-5.5 Pro
入力 ($/1M)       $2.50         $5.00         $30.00
出力 ($/1M)       $15.00        $30.00        $180.00
コンテキスト       512K          1M            1M

一見2倍のインパクトに見えるが、OpenAIは「出力トークン数が約40%削減される」と述べている。理由はモデルの応答精度向上により、同じタスクに必要な往復回数が減るからだ。試算すると：

# 実コスト試算（仮定：入力1M / 出力1M per タスク）
# GPT-5.4
cost_54 = 1 * 2.50 + 1 * 15.00  # = $17.50

# GPT-5.5（出力40%削減想定）
cost_55 = 1 * 5.00 + 0.6 * 30.00  # = $23.00

# 実質コスト増加率
increase = (23.00 - 17.50) / 17.50  # ≈ 31%

出力削減率が実際に40%に達するかはワークロード依存だ。エージェントループで大量に往復するユースケースでは削減効果が出やすい。

GPT-5.5が特に強い用途

OpenAIが「設計上の強化点」として挙げる領域：

コーディング・デバッグ：コンテキストを跨いだ複数ファイルの変更
Webブラウジング＋リサーチ：情報収集・集約・レポート生成
スプレッドシート・ドキュメント：データ加工・分析・文書作成
マルチステップタスク：人間のフォローアップなしに継続する能力

Dan Shipper（Every社CEO）は「これまで使ったコーディングモデルの中で初めて『概念的な明晰さ』を感じた」と評価している。

開発者が今すぐ確認すべきこと

ChatGPT/Codex経由（プラン契約者）

Plus・Pro・Business・Enterpriseのユーザーはモデル選択からGPT-5.5を選択可能。

API経由（今後）

現時点ではAPIは「近日公開」だ。既存のGPT-5.4ベースのプロダクションシステムをすぐに切り替える必要はない。ただし以下の点を事前に確認しておくとよい：

# モデル名が確定次第、こうなる見込み
client.chat.completions.create(
    model="gpt-5.5",          # or "gpt-5.5-pro"
    messages=[...],
    max_tokens=4096,
)

コスト計画の再評価

出力トークン40%削減はOpenAIの主張であり、実際のシステムで検証が必要だ。移行前にサンプルリクエストでのトークン数を計測しておくことを推奨する。

注意点・未確認情報

API公開タイミング未確定：「very soon」とのみアナウンス。具体日時は不明。
出力削減40%は理論値：OpenAI主張の数値。ユースケース依存で実際の削減率は異なる。
GPT-5.5 Proの必要性：ほとんどのユースケースは標準GPT-5.5で十分と思われる。Proが有効なのは高精度が極めて重要な場面。
リスク分類「High」：OpenAIの内部基準でHighと判定されているが、Criticalではないとされる。外部からの検証はない。

まとめ

GPT-5.5は「予想通りの日に予想通りのモデルが出た」という形で登場した。コードネームSpudの時点から漏れていた情報と大きなギャップはない。ただし具体的な数字——Terminal-Bench 82.7%という競合との13ポイント差、API価格の2倍設定、1Mコンテキスト——は開発計画に直接影響する。APIが公開され次第、エージェントワークフロー向けのコスト・性能トレードオフを実測することが次のステップだ。

S	公式ソース確認済み
A	成功実績多数・失敗例少数
B	賛否両論
C	動作未確認・セキュリティリスク高
Z	個人所感