SJ blog
ai
A

信頼度ランク

S 公式ソース確認済み
A 成功実績多数・失敗例少数
B 賛否両論
C 動作未確認・セキュリティリスク高
Z 個人所感

Mistral Medium 3.5+Vibe Remoteエージェント——128B開放重みモデルとクラウド非同期コーディングエージェントが変えるもの

2026年4月29日、MistralがMedium 3.5(128B・256Kコンテキスト・SWE-bench 77.6%)とVibe Remote Agentsを発表。PRを自動作成するクラウドコーディングエージェントの仕組みと開発者への影響を解説する。

一言結論

Mistral Medium 3.5は128Bの密な開放重みモデル(modified MIT)でSWE-bench Verified 77.6%を達成。Vibe Remote Agentsによりコーディングセッションをクラウドで非同期実行し完了後にGitHub PRを自動作成できる。4 GPUで自己ホスト可能で、API・Le Chat・Ollamaから即日利用できる。

何が起きたか

2026年4月29日、Mistral AIはMistral Medium 3.5Vibe Remote Agentsを同時発表した。

  • Mistral Medium 3.5: 指示追従・推論・コーディングを単一モデルに統合した128Bの密なモデル。modified MITライセンスで開放重みが公開されている。
  • Vibe Remote Agents: コーディングセッションをクラウドで非同期実行し、完了後にGitHub PRを自動作成するインフラ。
  • Le Chat Work Mode: 複数ステップのリサーチ・分析・ツール連携タスクをこなすエージェントモードがプレビュー公開された。

Mistral Medium 3.5 のスペック

パラメータ数:    128B(dense)
コンテキスト窓:  256K トークン
ライセンス:      modified MIT(商用利用可)
SWE-bench Verified: 77.6%
τ³-Telecom:     91.4
入力形式:        テキスト+画像(nativeマルチモーダル)
推論モード:      configurable reasoning(extended thinking 有効化可)
最小GPUセット:   4× A100 / H100 で自己ホスト可能

ベンチマーク比較(参考)

モデルSWE-bench Verified備考
Mistral Medium 3.577.6%本稿対象
Devstral 274.3%Mistral前作
Qwen3.5 397B A17B76.1%MoEで5倍大きい
GPT-5.582.7%(Terminal-Bench)比較モデル異なる

Vibe Remote Agents の仕組み

従来のVibe(ローカルエージェント)はすべての処理を開発者のマシン上で行っていた。Vibe Remote Agentsではコーディングセッションがクラウド上のサンドボックスで動作し、開発者はターミナルを閉じても処理を継続できる。

従来のVibe(ローカル)
開発者PC → CLI → Vibe → ローカルファイルシステム
         ⚠️ ターミナルを閉じると停止

Vibe Remote Agents(クラウド)
開発者PC → CLI/Le Chat → リモートサンドボックス
                           ├─ ファイル編集
                           ├─ パッケージインストール
                           ├─ テスト実行
                           └─ GitHub PR 自動作成
                     ✅ 非同期・ターミナル不要

CLIからリモートセッションを起動する

# Mistral Vibe CLIのインストール
pip install mistral-vibe

# リモートエージェントセッションの開始
vibe start --remote \
  --task "src/auth/middleware.ts のJWT検証にリフレッシュトークンローテーションを追加してテストも書いて" \
  --repo https://github.com/yourorg/yourrepo \
  --branch feature/jwt-rotation

# セッションの状態確認(非同期)
vibe status <session-id>

# 完了通知はSlack/メールで受け取り可能

完了後、エージェントはGitHubのPRを自動作成し、変更内容と実行したテストの結果をPR本文に記載する。


Le Chat Work Mode の使い方

Le ChatのWork Mode(Preview)は複数のコネクタ(メールボックス・カレンダー・ドキュメント)を横断してタスクを実行する。

サポートされているコネクタ(Preview)
├─ GitHub(コード・PR・Issue)
├─ Gmail / Google Calendar
├─ Google Drive / Docs
├─ Notion
└─ Web検索(Brave Search)

感度の高いアクション(メール送信・PR merge等)は
実行前にユーザー確認が必要

API から直接使う

from mistralai import Mistral

client = Mistral(api_key="your-mistral-api-key")

# 標準補完
response = client.chat.complete(
    model="mistral-medium-3-5",
    messages=[
        {
            "role": "user",
            "content": "PythonでRedis分散ロックを実装してください。再入可能で、TTL付き、フェイルセーフ対応で。"
        }
    ]
)
print(response.choices[0].message.content)

# extended thinking を有効化
response = client.chat.complete(
    model="mistral-medium-3-5",
    messages=[{"role": "user", "content": "このRustのライフタイムエラーの根本原因を分析して"}],
    thinking={"type": "enabled", "budget_tokens": 4096}
)

自己ホスト(4 GPU構成例)

# Ollamaで動かす場合(ollama.com/library/mistral-medium-3.5)
ollama pull mistral-medium-3.5

# vLLMで動かす場合(4× A100 80GB)
pip install vllm

python -m vllm.entrypoints.openai.api_server \
  --model mistralai/mistral-medium-3.5 \
  --tensor-parallel-size 4 \
  --max-model-len 65536 \    # 256K全体はVRAM要確認
  --dtype bfloat16
# vLLMエンドポイントをOpenAI互換で呼び出す
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8000/v1",
    api_key="dummy"
)

completion = client.chat.completions.create(
    model="mistralai/mistral-medium-3.5",
    messages=[{"role": "user", "content": "認証ミドルウェアのバグを修正して"}]
)

注意点・未確認事項

  • modified MIT ライセンス: 「完全なMIT」ではなく制限条件がある可能性がある。商用利用前にMistralの利用規約を必ず確認すること(本稿執筆時点で詳細条件は未精査)。
  • 256K全体のVRAM: 256Kトークン全体を扱うには4× H100 80GB以上が必要。実用的には128K以下での運用推奨(未検証)。
  • Vibe Remote Agentsの料金: 現時点でAPIの従量課金に加えてコンピュート料金が発生するかは不明。
  • Le Chat Work Mode: Preview段階であり、コネクタの対応状況・精度は今後変わる可能性がある。

参考リンク

注記: ライセンス詳細・Vibe Remote Agentsの料金体系は本稿執筆時点(2026-05-04)で正式発表待ち。Mistral公式ページで最新情報を確認すること。