ai
A
信頼度ランク
| S | 公式ソース確認済み |
| A | 成功実績多数・失敗例少数 |
| B | 賛否両論 |
| C | 動作未確認・セキュリティリスク高 |
| Z | 個人所感 |
Mistral Medium 3.5+Vibe Remoteエージェント——128B開放重みモデルとクラウド非同期コーディングエージェントが変えるもの
2026年4月29日、MistralがMedium 3.5(128B・256Kコンテキスト・SWE-bench 77.6%)とVibe Remote Agentsを発表。PRを自動作成するクラウドコーディングエージェントの仕組みと開発者への影響を解説する。
一言結論
Mistral Medium 3.5は128Bの密な開放重みモデル(modified MIT)でSWE-bench Verified 77.6%を達成。Vibe Remote Agentsによりコーディングセッションをクラウドで非同期実行し完了後にGitHub PRを自動作成できる。4 GPUで自己ホスト可能で、API・Le Chat・Ollamaから即日利用できる。
何が起きたか
2026年4月29日、Mistral AIはMistral Medium 3.5とVibe Remote Agentsを同時発表した。
- Mistral Medium 3.5: 指示追従・推論・コーディングを単一モデルに統合した128Bの密なモデル。modified MITライセンスで開放重みが公開されている。
- Vibe Remote Agents: コーディングセッションをクラウドで非同期実行し、完了後にGitHub PRを自動作成するインフラ。
- Le Chat Work Mode: 複数ステップのリサーチ・分析・ツール連携タスクをこなすエージェントモードがプレビュー公開された。
Mistral Medium 3.5 のスペック
パラメータ数: 128B(dense)
コンテキスト窓: 256K トークン
ライセンス: modified MIT(商用利用可)
SWE-bench Verified: 77.6%
τ³-Telecom: 91.4
入力形式: テキスト+画像(nativeマルチモーダル)
推論モード: configurable reasoning(extended thinking 有効化可)
最小GPUセット: 4× A100 / H100 で自己ホスト可能
ベンチマーク比較(参考)
| モデル | SWE-bench Verified | 備考 |
|---|---|---|
| Mistral Medium 3.5 | 77.6% | 本稿対象 |
| Devstral 2 | 74.3% | Mistral前作 |
| Qwen3.5 397B A17B | 76.1% | MoEで5倍大きい |
| GPT-5.5 | 82.7%(Terminal-Bench) | 比較モデル異なる |
Vibe Remote Agents の仕組み
従来のVibe(ローカルエージェント)はすべての処理を開発者のマシン上で行っていた。Vibe Remote Agentsではコーディングセッションがクラウド上のサンドボックスで動作し、開発者はターミナルを閉じても処理を継続できる。
従来のVibe(ローカル)
開発者PC → CLI → Vibe → ローカルファイルシステム
⚠️ ターミナルを閉じると停止
Vibe Remote Agents(クラウド)
開発者PC → CLI/Le Chat → リモートサンドボックス
├─ ファイル編集
├─ パッケージインストール
├─ テスト実行
└─ GitHub PR 自動作成
✅ 非同期・ターミナル不要
CLIからリモートセッションを起動する
# Mistral Vibe CLIのインストール
pip install mistral-vibe
# リモートエージェントセッションの開始
vibe start --remote \
--task "src/auth/middleware.ts のJWT検証にリフレッシュトークンローテーションを追加してテストも書いて" \
--repo https://github.com/yourorg/yourrepo \
--branch feature/jwt-rotation
# セッションの状態確認(非同期)
vibe status <session-id>
# 完了通知はSlack/メールで受け取り可能
完了後、エージェントはGitHubのPRを自動作成し、変更内容と実行したテストの結果をPR本文に記載する。
Le Chat Work Mode の使い方
Le ChatのWork Mode(Preview)は複数のコネクタ(メールボックス・カレンダー・ドキュメント)を横断してタスクを実行する。
サポートされているコネクタ(Preview)
├─ GitHub(コード・PR・Issue)
├─ Gmail / Google Calendar
├─ Google Drive / Docs
├─ Notion
└─ Web検索(Brave Search)
感度の高いアクション(メール送信・PR merge等)は
実行前にユーザー確認が必要
API から直接使う
from mistralai import Mistral
client = Mistral(api_key="your-mistral-api-key")
# 標準補完
response = client.chat.complete(
model="mistral-medium-3-5",
messages=[
{
"role": "user",
"content": "PythonでRedis分散ロックを実装してください。再入可能で、TTL付き、フェイルセーフ対応で。"
}
]
)
print(response.choices[0].message.content)
# extended thinking を有効化
response = client.chat.complete(
model="mistral-medium-3-5",
messages=[{"role": "user", "content": "このRustのライフタイムエラーの根本原因を分析して"}],
thinking={"type": "enabled", "budget_tokens": 4096}
)
自己ホスト(4 GPU構成例)
# Ollamaで動かす場合(ollama.com/library/mistral-medium-3.5)
ollama pull mistral-medium-3.5
# vLLMで動かす場合(4× A100 80GB)
pip install vllm
python -m vllm.entrypoints.openai.api_server \
--model mistralai/mistral-medium-3.5 \
--tensor-parallel-size 4 \
--max-model-len 65536 \ # 256K全体はVRAM要確認
--dtype bfloat16
# vLLMエンドポイントをOpenAI互換で呼び出す
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:8000/v1",
api_key="dummy"
)
completion = client.chat.completions.create(
model="mistralai/mistral-medium-3.5",
messages=[{"role": "user", "content": "認証ミドルウェアのバグを修正して"}]
)
注意点・未確認事項
- modified MIT ライセンス: 「完全なMIT」ではなく制限条件がある可能性がある。商用利用前にMistralの利用規約を必ず確認すること(本稿執筆時点で詳細条件は未精査)。
- 256K全体のVRAM: 256Kトークン全体を扱うには4× H100 80GB以上が必要。実用的には128K以下での運用推奨(未検証)。
- Vibe Remote Agentsの料金: 現時点でAPIの従量課金に加えてコンピュート料金が発生するかは不明。
- Le Chat Work Mode: Preview段階であり、コネクタの対応状況・精度は今後変わる可能性がある。
参考リンク
- Mistral AI: Remote agents in Vibe. Powered by Mistral Medium 3.5
- Ollama: mistral-medium-3.5
- MarkTechPost: Mistral AI Launches Remote Agents in Vibe
- The Decoder: Mistral’s new flagship Medium 3.5
- Reddit r/MachineLearning: 議論スレッド
注記: ライセンス詳細・Vibe Remote Agentsの料金体系は本稿執筆時点(2026-05-04)で正式発表待ち。Mistral公式ページで最新情報を確認すること。