JobBench: エージェントの仕事を人間の意志に合わせる JobBench: Aligning Agent Work With Human Will
重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月27日 Published May 27
AI要約 職業AIエージェントを経済的価値だけでなく人間の意志との整合性で評価する新ベンチマーク「JobBench」を提案。
EN JobBench is a new benchmark for occupational AI agents that goes beyond economic replacement metrics to evaluate alignment with human will and intent.
og fallback