NVIDIA、視覚・音声・言語を統合したNemotron 3 Nano Omniモデルを発表 NVIDIA Launches Nemotron 3 Nano Omni Model, Unifying Vision, Audio and Language for up to 9x More Efficient AI Agents
AI要約 NVIDIAは視覚・音声・言語を統一的に扱うマルチモーダルモデル「Nemotron 3 Nano Omni」を発表した。AIエージェントを最大9倍効率化し、文書解析や音声対話など多様なタスクに対応する小型モデルとして提供される。
EN NVIDIA announced Nemotron 3 Nano Omni, a unified multimodal model integrating vision, audio and language to power AI agents up to 9x more efficiently across tasks like document understanding and speech interaction.
og