#ibm-research — TECH Dashboard

blog local-llm 4mo ago ·

huggingface-blog

IBMとUC Berkeley、IT-BenchとMASTで企業向けAIエージェントの失敗要因を診断 IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月19日 Published Feb 19

AI要約 IBMリサーチとUC Berkeleyは、企業ITタスクにおけるAIエージェントの失敗を分析する診断フレームワークを発表した。IT-Benchで実環境タスクを評価し、MASTで失敗モードを分類することで、SRE・CISO・FinOps領域における低い成功率の原因を体系的に特定する。

EN IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

#enterprise #huggingface #open-model +5

huggingface.co →

fallback

#ibm-research 1 total

Entries page 1/1 · 1 total

IBMとUC Berkeley、IT-BenchとMASTで企業向けAIエージェントの失敗要因を診断 IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST