BoostAPR: 実行検証と二重報酬モデルによる自動プログラム修正の強化学習 BoostAPR: Boosting Automated Program Repair via Execution-Grounded Reinforcement Learning with Dual Reward Models
AI要約 BoostAPRは大規模言語モデルによる自動プログラム修正(APR)を強化学習で改善する手法。実行結果に基づく検証と、パッチの妥当性とコード品質を評価する二重報酬モデルを組み合わせ、テスト通過だけでなく意味的に正しい修正の生成を目指す。
EN BoostAPR enhances LLM-based automated program repair through execution-grounded reinforcement learning combined with dual reward models that evaluate both patch correctness and code quality, aiming beyond mere test-pass plausibility.