HomeTags#coding-agents

#coding-agents page 1/1 · 2 total

YESTERDAY 2 entries
paper research 1d ago · arxiv-cs-se

コーディングエージェント設定ファイルの指示遵守: 4変数の要因分析 Instruction Adherence in Coding Agent Configuration Files: A Factorial Study of Four File-Structure Variables

AI要約 コーディングエージェントの設定ファイルにおける構造変数(階層・順序・形式・粒度)が、LLMの指示遵守率にどう影響するかを4要因実験で評価した研究。ファイル構造の選択が遵守精度を有意に左右することを示し、実務上の設計指針を導く。

EN A factorial study examining how four file-structure variables in coding agent configuration files affect LLM instruction adherence, offering empirical guidance on structuring AGENTS.md-style files for reliable behaviour.

arxiv.org
paper research 1d ago · arxiv-cs-se

SWE Atlas: イシュー解決を超えるコーディングエージェント評価基盤 SWE Atlas: Benchmarking Coding Agents Beyond Issue Resolution

AI要約 SWE Atlasは、従来のイシュー解決中心のベンチマークを超え、コーディングエージェントの能力を多面的に評価する新たな基盤である。複数のタスク種別や実環境に近い条件を導入し、現行モデルの強みと弱みをより精緻に可視化することを目指す。

EN SWE Atlas proposes a broader benchmark suite for coding agents that goes beyond GitHub issue resolution, evaluating diverse software engineering tasks to expose strengths and weaknesses that single-task benchmarks like SWE-bench miss.

arxiv.org