HomeTags#ibm-research

Tag timeline

#ibm-research 1 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 1
Showing 1
Page 1/1
Updated 1h ago

Entries page 1/1 · 1 total

Thu, Feb 19 1 entries
blog local-llm 4mo ago · huggingface-blog

IBMとUC Berkeley、IT-BenchとMASTで企業向けAIエージェントの失敗要因を診断 IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月19日 Published Feb 19

AI要約 IBMリサーチとUC Berkeleyは、企業ITタスクにおけるAIエージェントの失敗を分析する診断フレームワークを発表した。IT-Benchで実環境タスクを評価し、MASTで失敗モードを分類することで、SRE・CISO・FinOps領域における低い成功率の原因を体系的に特定する。

EN IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

fallback