Anchor: エージェントベンチマーク生成におけるアーティファクトドリフトの軽減 Anchor: Mitigating Artifact Drift in Agent Benchmark Generation
AI要約 AIエージェント向けベンチマーク生成時に生じるアーティファクトドリフトを軽減する手法「Anchor」を提案した研究論文。
EN Anchor is a proposed method to reduce artifact drift when generating benchmarks for AI agents tackling long-horizon enterprise tasks.
og fallback