CroCo: 自己生成文を用いたクロスリンガル対照的選好チューニング CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations
重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月27日 Published May 27
AI要約 大規模言語モデルの自己生成応答に対してクロスリンガルな対照的選好学習を適用し、多言語性能を向上させる手法CroCoを提案。
EN arXiv:2605.26293v1 Announce Type: new Abstract: Prior work establishes that controlled contrastiveness between self-generated responses from large language models, set via reward scores, improves down
og fallback