NVIDIA、視覚・音声・言語を統合したNemotron 3 Nano Omniモデルを発表 NVIDIA Launches Nemotron 3 Nano Omni Model, Unifying Vision, Audio and Language for up to 9x More Efficient AI Agents
AI 3 行サマリ
- NVIDIAは視覚・音声・言語を統一的に扱うマルチモーダルモデル「Nemotron 3 Nano Omni」を発表した。
- AIエージェントを最大9倍効率化し、文書解析や音声対話など多様なタスクに対応する小型モデルとして提供される。
English summary
- NVIDIA announced Nemotron 3 Nano Omni, a unified multimodal model integrating vision, audio and language to power AI agents up to 9x more efficiently across tasks like document understanding and speech interaction.
※ この記事の本文は近日中に AI が生成して差し替わります。現時点では上記サマリをご参照ください。
元記事を読む
blogs.nvidia.com
本ページの本文・要約は AI による自動生成です。正確性は元記事 (blogs.nvidia.com) をご確認ください。