Mistral Medium 3.5＋Vibe Remoteエージェント——128B開放重みモデルとクラウド非同期コーディングエージェントが変えるもの

何が起きたか

2026年4月29日、Mistral AIはMistral Medium 3.5とVibe Remote Agentsを同時発表した。

Mistral Medium 3.5: 指示追従・推論・コーディングを単一モデルに統合した128Bの密なモデル。modified MITライセンスで開放重みが公開されている。
Vibe Remote Agents: コーディングセッションをクラウドで非同期実行し、完了後にGitHub PRを自動作成するインフラ。
Le Chat Work Mode: 複数ステップのリサーチ・分析・ツール連携タスクをこなすエージェントモードがプレビュー公開された。

Mistral Medium 3.5 のスペック

パラメータ数:    128B（dense）
コンテキスト窓:  256K トークン
ライセンス:      modified MIT（商用利用可）
SWE-bench Verified: 77.6%
τ³-Telecom:     91.4
入力形式:        テキスト＋画像（nativeマルチモーダル）
推論モード:      configurable reasoning（extended thinking 有効化可）
最小GPUセット:   4× A100 / H100 で自己ホスト可能

ベンチマーク比較（参考）

モデル	SWE-bench Verified	備考
Mistral Medium 3.5	77.6%	本稿対象
Devstral 2	74.3%	Mistral前作
Qwen3.5 397B A17B	76.1%	MoEで5倍大きい
GPT-5.5	82.7%（Terminal-Bench）	比較モデル異なる

Vibe Remote Agents の仕組み

従来のVibe（ローカルエージェント）はすべての処理を開発者のマシン上で行っていた。Vibe Remote Agentsではコーディングセッションがクラウド上のサンドボックスで動作し、開発者はターミナルを閉じても処理を継続できる。

従来のVibe（ローカル）
開発者PC → CLI → Vibe → ローカルファイルシステム
         ⚠️ ターミナルを閉じると停止

Vibe Remote Agents（クラウド）
開発者PC → CLI/Le Chat → リモートサンドボックス
                           ├─ ファイル編集
                           ├─ パッケージインストール
                           ├─ テスト実行
                           └─ GitHub PR 自動作成
                     ✅ 非同期・ターミナル不要

CLIからリモートセッションを起動する

# Mistral Vibe CLIのインストール
pip install mistral-vibe

# リモートエージェントセッションの開始
vibe start --remote \
  --task "src/auth/middleware.ts のJWT検証にリフレッシュトークンローテーションを追加してテストも書いて" \
  --repo https://github.com/yourorg/yourrepo \
  --branch feature/jwt-rotation

# セッションの状態確認（非同期）
vibe status <session-id>

# 完了通知はSlack/メールで受け取り可能

完了後、エージェントはGitHubのPRを自動作成し、変更内容と実行したテストの結果をPR本文に記載する。

Le Chat Work Mode の使い方

Le ChatのWork Mode（Preview）は複数のコネクタ（メールボックス・カレンダー・ドキュメント）を横断してタスクを実行する。

サポートされているコネクタ（Preview）
├─ GitHub（コード・PR・Issue）
├─ Gmail / Google Calendar
├─ Google Drive / Docs
├─ Notion
└─ Web検索（Brave Search）

感度の高いアクション（メール送信・PR merge等）は
実行前にユーザー確認が必要

API から直接使う

from mistralai import Mistral

client = Mistral(api_key="your-mistral-api-key")

# 標準補完
response = client.chat.complete(
    model="mistral-medium-3-5",
    messages=[
        {
            "role": "user",
            "content": "PythonでRedis分散ロックを実装してください。再入可能で、TTL付き、フェイルセーフ対応で。"
        }
    ]
)
print(response.choices[0].message.content)

# extended thinking を有効化
response = client.chat.complete(
    model="mistral-medium-3-5",
    messages=[{"role": "user", "content": "このRustのライフタイムエラーの根本原因を分析して"}],
    thinking={"type": "enabled", "budget_tokens": 4096}
)

自己ホスト（4 GPU構成例）

# Ollamaで動かす場合（ollama.com/library/mistral-medium-3.5）
ollama pull mistral-medium-3.5

# vLLMで動かす場合（4× A100 80GB）
pip install vllm

python -m vllm.entrypoints.openai.api_server \
  --model mistralai/mistral-medium-3.5 \
  --tensor-parallel-size 4 \
  --max-model-len 65536 \    # 256K全体はVRAM要確認
  --dtype bfloat16

# vLLMエンドポイントをOpenAI互換で呼び出す
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8000/v1",
    api_key="dummy"
)

completion = client.chat.completions.create(
    model="mistralai/mistral-medium-3.5",
    messages=[{"role": "user", "content": "認証ミドルウェアのバグを修正して"}]
)

注意点・未確認事項

modified MIT ライセンス: 「完全なMIT」ではなく制限条件がある可能性がある。商用利用前にMistralの利用規約を必ず確認すること（本稿執筆時点で詳細条件は未精査）。
256K全体のVRAM: 256Kトークン全体を扱うには4× H100 80GB以上が必要。実用的には128K以下での運用推奨（未検証）。
Vibe Remote Agentsの料金: 現時点でAPIの従量課金に加えてコンピュート料金が発生するかは不明。
Le Chat Work Mode: Preview段階であり、コネクタの対応状況・精度は今後変わる可能性がある。

参考リンク

注記: ライセンス詳細・Vibe Remote Agentsの料金体系は本稿執筆時点（2026-05-04）で正式発表待ち。Mistral公式ページで最新情報を確認すること。

S	公式ソース確認済み
A	成功実績多数・失敗例少数
B	賛否両論
C	動作未確認・セキュリティリスク高
Z	個人所感