OpenEnv実践:実環境でのツール使用エージェント評価 OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments
AI要約 Hugging FaceがOpenEnvとTuringベンチマークを用いて、実環境でツールを活用するAIエージェントの能力を体系的に評価する手法を解説。
EN OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments