強化学習によるVLMのニューロシンボリック言語推論の促進 Incentivizing Neuro-symbolic Language-based Reasoning in VLMs via Reinforcement Learning
AI要約 本論文は、強化学習を用いて視覚言語モデル(VLM)にニューロシンボリックな言語ベース推論を促す手法を提案。記号的構造を活用した中間推論を生成させることで、複雑な視覚推論タスクの精度向上を図る。
EN This paper proposes a reinforcement learning approach to incentivize neuro-symbolic language-based reasoning in vision-language models (VLMs), guiding them to generate symbolic intermediate reasoning steps for improved performance on complex visual reasoning tasks.
arxiv.org →