HomeTags#reinforcement-learning

#reinforcement-learning page 1/1 · 2 total

TODAY 2 entries
NEW paper research 5h ago · arxiv-cs-cl

本論文は、勾配ベースモデルと微分不可能なモデルを強化学習を介して結合する相互協調学習(RCT)を提案する Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning

AI要約 本論文は、勾配ベースモデルと微分不可能なモデルを強化学習を介して結合する相互協調学習(RCT)を提案する。両モデルが互いに教師信号を与え合うことで、異なる性質のモデル間での知識転移と協調的な性能向上を実現する枠組みを示す。

EN This paper proposes Reciprocal Co-Training (RCT), a framework that couples gradient-based and non-differentiable models via reinforcement learning, allowing the two model types to provide mutual supervision signals and jointly improve performance.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、モンテカルロ木探索(MCTS)を用いてエージェントのスキルを二階層最適化する手法を提案する Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

AI要約 本論文は、モンテカルロ木探索(MCTS)を用いてエージェントのスキルを二階層最適化する手法を提案する。上位層でスキル構造を探索し、下位層でパラメータを調整することで、複雑タスクにおけるエージェント性能を向上させる。

EN This paper proposes a bilevel optimization framework for agent skills using Monte Carlo Tree Search, where the upper level explores skill structures and the lower level tunes parameters to improve agent performance on complex tasks.

arxiv.org
fallback