SetupX: LLMエージェントはコードリポジトリのセットアップ失敗から学習できるか? SetupX: Can LLM Agents Learn from Past Failures in Functionality-Correct Code Repository Setup?
重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月27日 Published May 27
AI要約 リポジトリの実行環境構成を正しく行うベンチマーク SetupX を提案し、LLMエージェントが過去の失敗から学習できるかを検証した研究。
EN SetupX is a benchmark studying whether LLM agents can learn from past failures to correctly configure execution environments for code repositories.
fallback