HomeTags#tool-use

Tag timeline

#tool-use 7 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 7
Showing 7
Page 1/1
Updated 1h ago

Entries page 1/1 · 7 total

Fri, May 29 1 entries
blog claude 3w ago · zenn-claude

Claude Agent SDKで"自作Claude Code"を作る──スマホ操作ツールを実装してわかったこと JA Claude Agent SDKで"自作Claude Code"を作る──スマホ操作ツールを実装してわかったこと

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 5月29日 Published May 29

AI要約 この記事は Claude on SonicGarden の記事です。ソニックガーデンのプログラマが、Claude Codeの活用について書いています。#claude_on_sonicgarden はじめに Claude Codeを日常的に使

fallback
Thu, May 28 1 entries
paper research 3w ago · arxiv-cs-se

Tool Forge: 統治されたエージェント実行のための検証付きツールチェーン Tool Forge: A Validation-Carrying Toolchain for Governed Agentic Execution

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月28日 Published May 28

AI要約 LLMエージェントがAPI呼び出しやファイル操作を安全に行うための検証機構を組み込んだツールチェーン「Tool Forge」を提案する研究論文。

EN arXiv:2605.28000v1 Announce Type: new Abstract: Large language model agents are increasingly expected to perform operational work: calling APIs, manipulating files, assembling workflows, and acting in

fallback
Wed, May 27 1 entries
paper research 3w ago · arxiv-cs-se

ツールスキーマ圧縮により制約されたコンテキスト予算下でのAgentic RAGを実現 Tool-Schema Compression Enables Agentic RAG Under Constrained Context Budgets

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月27日 Published May 27

AI要約 多数のツール定義を持つAgentic RAGシステムで、ツールスキーマの圧縮によりコンテキスト制約問題を解決する手法を提案。

EN A new approach compresses tool schemas in agentic RAG systems to resolve the resource conflict between tool definitions and available context budget in LLMs.

Tool-Schema Compression Enables Agentic RAG Under Constrained Context Budgets og fallback
Tue, May 26 1 entries
blog claude 3w ago · zenn-claude

AIエージェントのツール定義設計原則:スキーマ・命名・レスポンスの実践ガイド A practical guide covering seven design principles for AI agent tool definitions using JSO…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 5月26日 Published May 26

AI要約 AIエージェント向けツール定義(JSON Schema)の設計原則7つを解説。命名・説明文・パラメータ設計の具体的なベストプラクティスを紹介する実践ガイド。

EN A practical guide covering seven design principles for AI agent tool definitions using JSON Schema, with concrete best practices for naming, descriptions, and parameter design.

fallback
Wed, Apr 8 1 entries
NEW blog claude 2mo ago · anthropic-engineering

Anthropicが解説するManaged Agentsの設計思想 Scaling Managed Agents: Decoupling the brain from the hands

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 4月8日 Published Apr 8

AI要約 Anthropicは、Claudeを基盤とする「Managed Agents」の設計指針を公開した。エージェントを管理する側の視点から、信頼境界、権限委譲、観測性、長時間実行ジョブの扱いなど、本番運用で重要となる要素を整理している。

EN Harnesses encode assumptions that go stale as models improve. Managed Agents-our hosted service for long-horizon agent work-is built around interfaces that stay stable as harnesses change.

fallback
Thu, Feb 12 1 entries
blog local-llm 4mo ago · huggingface-blog

OpenEnv実践:実環境でのツール使用エージェント評価 OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月12日 Published Feb 12

AI要約 Hugging FaceがOpenEnvとTuringベンチマークを用いて、実環境でツールを活用するAIエージェントの能力を体系的に評価する手法を解説。

EN OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments

fallback
Thu, Jan 15 1 entries
🔥 HOT blog local-llm 5mo ago · huggingface-blog

Open Responses: 知っておくべきこと Open Responses: What you need to know

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 1月15日 Published Jan 15

AI要約 Hugging FaceがOpenAIのResponses APIと互換のオープンソース実装「Open Responses」を発表。任意のLLMやMCPツール、ローカルモデルと連携しエージェント開発をベンダーロックインなしで実現。

EN Open Responses: What you need to know

fallback