OPPO「X-OmniClaw」——カメラ・画面・音声を統合処理するAndroidエッジネイティブAIエージェントをオープンソース公開
OPPOのMente Labがオープンソース公開したX-OmniClawは、Android端末上でカメラ・スクリーン・音声を同時処理しアプリをまたいでタスクを実行するエッジネイティブなAIエージェント。物理端末上で直接動作し、クラウドは高レベル推論のみに使用する4層アーキテクチャを採用。
OPPOのMente Labがオープンソース公開したX-OmniClawは、Android端末上でカメラ・スクリーン・音声を同時処理しアプリをまたいでタスクを実行するエッジネイティブなAIエージェント。物理端末上で直接動作し、クラウドは高レベル推論のみに使用する4層アーキテクチャを採用。
元OpenAI CTO ミラ・ムラーティが率いるThinking Machines Labが276B MoEモデルTML-Interaction-Smallを発表。0.40秒応答・マルチモーダル連続処理でOpenAI Realtime APIに挑む新アーキテクチャを解説。
2026年4月28日、NVIDIAがNemotron 3 Nano Omniをリリース。視覚・音声・テキスト・コードを単一モデルで処理するMoEアーキテクチャ(30B総量/3Bアクティブ)でApache 2.0ライセンス。Nemotron 2比4倍のスループット。エッジAIエージェントへの実装方法を解説する。