HomeTags#embodied-ai

#embodied-ai page 1/1 · 3 total

TODAY 1 entries
NEW paper research 2h ago · arxiv-cs-ai

D-VLA: VLAモデル向け高並列分散非同期強化学習フレームワーク D-VLA: A High-Concurrency Distributed Asynchronous Reinforcement Learning Framework for Vision-Language-Action Models

AI要約 D-VLAは視覚言語行動(VLA)モデルの強化学習を効率化する分散非同期フレームワーク。ロールアウト収集と学習を分離し高い並列性を実現することで、ロボット制御等の大規模VLA学習のスループットと安定性を向上させると見られる。

EN arXiv:2605.13276v2 Announce Type: replace Abstract: The rapid evolution of Embodied AI has enabled Vision-Language-Action (VLA) models to excel in multimodal perception and task execution. However, ap

arxiv.org
D-VLA: A High-Concurrency Distributed Asynchronous Reinforcement Learning Framework for Vision-Language-Action Models og
Tue, Apr 14 1 entries
NEW blog gemini 4w ago · google-deepmind

Gemini Robotics-ER 1.6: 身体化推論を強化し実世界ロボット制御を加速 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

AI要約 Google DeepMindは身体化推論モデル「Gemini Robotics-ER 1.6」を発表した。空間理解や複雑なタスク計画能力を強化し、実世界のロボット操作精度を向上。Gemini APIを通じて開発者が利用できる。

EN Gemini Robotics ER 1.6: Enhancing spatial reasoning and multi-view understanding for autonomous robotics.

deepmind.google
Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning media
Thu, Nov 13 1 entries
NEW blog gemini 6mo ago · google-deepmind

SIMA 2: 仮想3D世界で推論・学習する Gemini 搭載エージェント SIMA 2: An Agent that Plays, Reasons, and Learns With You in Virtual 3D Worlds

AI要約 Google DeepMind は、Gemini を基盤とする汎用ゲームAIエージェント「SIMA 2」を発表した。前世代と比べ複雑な指示への追従や推論能力が向上し、未学習のゲーム環境でも自己学習を通じてタスクを遂行できるようになった。

EN Introducing SIMA 2, a Gemini-powered AI agent that can think, understand, and take actions in interactive environments.

deepmind.google
SIMA 2: An Agent that Plays, Reasons, and Learns With You in Virtual 3D Worlds media