信頼度ランク
| S | 公式ソース確認済み |
| A | 成功実績多数・失敗例少数 |
| B | 賛否両論 |
| C | 動作未確認・セキュリティリスク高 |
| Z | 個人所感 |
Gemma 4:Apache 2.0で商用利用自由になったGoogleの最強オープンモデル
Google DeepMindがGemma 4を2026年4月にリリース。E2B〜31B Dense まで4サイズ、Apache 2.0ライセンスでマルチモーダル対応。オープンモデルの勢力図が塗り変わった。
一言結論
Gemma 4はApache 2.0で商用制限なし・マルチモーダル・256Kコンテキストを実現し、オープンモデル最高水準に到達した。自社インフラでLLMを動かしたいチームにとって最有力候補となった。
背景:オープンモデルが「本物の選択肢」になる転換点
2026年4月2日、Google DeepMindが Gemma 4 を発表した。前世代(Gemma 3)から大幅に強化されただけでなく、ライセンスを Apache 2.0 に変更したことで、商用プロダクトへの組み込みが事実上無制限になった。これはMeta LlamaやMistralと並んで、オープンモデルエコシステムの勢力図を塗り変えるリリースだ。
モデルラインナップ
Gemma 4 は 4 つのサイズで提供される。
| モデル | パラメータ | 特徴 | 主な用途 |
|---|---|---|---|
| E2B | Effective 2B | 音声入力対応、128Kコンテキスト | エッジデバイス、モバイル |
| E4B | Effective 4B | 音声入力対応、128Kコンテキスト | ローエンドサーバー |
| 26B MoE | 26B Mixture of Experts | 256Kコンテキスト | バランス型推論サーバー |
| 31B Dense | 31B Dense | 256Kコンテキスト | 高精度タスク、商用API代替 |
Arena AI リーダーボードでは 31B が全オープンモデル中3位、26B が6位を記録している(2026年4月時点)。
主な技術的特徴
ネイティブマルチモーダル
全サイズが画像・動画を標準入力として処理できる。E2B と E4B はさらに 音声入力(音声認識・理解)にも対応。テキストだけで構築されていた従来のオープンモデルとは根本的に異なる設計だ。
# Hugging Face Transformers での基本的な使い方
from transformers import AutoProcessor, Gemma4ForConditionalGeneration
import torch
model_id = "google/gemma-4-e4b-it"
processor = AutoProcessor.from_pretrained(model_id)
model = Gemma4ForConditionalGeneration.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
)
# 画像 + テキストの入力例
messages = [
{
"role": "user",
"content": [
{"type": "image", "url": "https://example.com/image.jpg"},
{"type": "text", "text": "この画像に写っているものを説明してください"},
],
}
]
inputs = processor.apply_chat_template(
messages,
add_generation_prompt=True,
tokenize=True,
return_tensors="pt",
).to(model.device)
outputs = model.generate(**inputs, max_new_tokens=512)
print(processor.decode(outputs[0]))
140言語対応・長いコンテキスト
E2B/E4B は 128K トークン、26B/31B は 256K トークン のコンテキストウィンドウを持つ。日本語を含む 140 以上の言語でネイティブ学習済みのため、日本語タスクへの転用も追加ファインチューニングなしで実用レベルを期待できる。
Apache 2.0 ライセンスの意義
前世代の Gemma は独自のカスタムライセンスで、商用利用や再配布に制限があった。Gemma 4 の Apache 2.0 化により:
- 商用製品への組み込みが自由
- モデルの改変・再配布が自由
- SaaS の基盤モデルとして利用可能
❌ 旧 Gemma 系:商用利用前に利用規約の詳細確認が必要
✅ Gemma 4:Apache 2.0 の範囲内で何でも可
落とし穴・注意点
- ハードウェア要件:31B Dense モデルは量子化(4bit/8bit)なしには家庭用 GPU では動かない。商用利用の場合 A100/H100 クラスが現実的
- ベンチマークと実務のギャップ:Arena スコアは一般的な能力評価。コードや医療・法律など特化ドメインでは依然として GPT-4o / Claude Opus 4.7 の方が優れる可能性がある
- マルチモーダルの精度:動画理解はまだ発展途上で、長時間動画の細部把握には不確実性がある
まとめ
Gemma 4 はオープンモデルが「商用利用できる賢いモデル」としてクローズドAPIの真の代替になった最初のリリースといえる。自前インフラ・オフライン推論・データプライバシー要件がある場面では、今後の第一候補として評価する価値がある。