#moe (4 件)

ai 2026年5月16日

Thinking Machines TML-Interaction-Small——0.4秒応答・200msマイクロターンで「フル二重」AIが実現する新対話モデル

元OpenAI CTO ミラ・ムラーティが率いるThinking Machines Labが276B MoEモデルTML-Interaction-Smallを発表。0.40秒応答・マルチモーダル連続処理でOpenAI Realtime APIに挑む新アーキテクチャを解説。

#ai #llm #realtime #multimodal #moe #voice-ai #interaction-model #thinking-machines

記事へ →

ai 2026年5月9日

Moonshot AI Kimiが$20B評価額・$2B調達——中国オープンソースLLMがGPT-5.4を上回ったSWEベンチの実態

中国のMoonshot AIがMeituan主導で$20B評価額・$2B調達を完了。Kimi K2.6はSWE-Bench Proでスコア58.6を記録しGPT-5.4（57.7）を上回る。API・モデル仕様・開発者への影響を解説。

#moonshot-ai #kimi #llm #open-source #china #ai #funding #swe-bench #moe #api

記事へ →

ai 2026年5月2日

NVIDIA Nemotron 3 Nano Omni——Apache 2.0・30BパラメータのオープンマルチモーダルモデルでエッジAIエージェントを構築する

2026年4月28日、NVIDIAがNemotron 3 Nano Omniをリリース。視覚・音声・テキスト・コードを単一モデルで処理するMoEアーキテクチャ（30B総量/3Bアクティブ）でApache 2.0ライセンス。Nemotron 2比4倍のスループット。エッジAIエージェントへの実装方法を解説する。

#nvidia #nemotron #open-source #multimodal #ai-agents #llm #moe #edge-ai #inference #apache2

記事へ →

ai 2026年4月30日

Llama 4 Scout実践ガイド：10Mトークンコンテキストの現実と、ローカル・API運用の使い分け

Metaが4月5日にリリースしたLlama 4 Scout（MoE 17B/109B、Llama Community License）は10Mトークンコンテキストを謳うが、実際の制約は多い。$0.08/M入力トークンのAPI運用と、Apple Silicon・H100でのローカル展開の現実的な限界を整理する。

#llama4 #meta #open-source #llm #ai #local-llm #moe #context-window #inference #ollama

記事へ →