HomeTags#preference-learning

Tag timeline

#preference-learning 1 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 1
Showing 1
Page 1/1
Updated 1h ago

Entries page 1/1 · 1 total

Wed, May 27 1 entries
paper research 3w ago · arxiv-cs-cl

CroCo: 自己生成文を用いたクロスリンガル対照的選好チューニング CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月27日 Published May 27

AI要約 大規模言語モデルの自己生成応答に対してクロスリンガルな対照的選好学習を適用し、多言語性能を向上させる手法CroCoを提案。

EN arXiv:2605.26293v1 Announce Type: new Abstract: Prior work establishes that controlled contrastiveness between self-generated responses from large language models, set via reward scores, improves down

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations og fallback