#llm-ops — TECH Dashboard

blog claude 4w ago ·

zenn-claude

RAG のコストは『検索回数』で決まる: 毎回検索しないアーキテクチャの設計論 JA RAG のコストは『検索回数』で決まる: 毎回検索しないアーキテクチャの設計論

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 5月29日 Published May 29

AI要約 LLM のコスト最適化には大きく 2 つの軸があります。1 つは「1 クエリで何を読ませるか」= 入力トークンを減らす設計、もう 1 つが本稿で扱う「そもそも検索・生成をするか」= 重い処理の回数を減らす設計です。本稿は後者、「毎回検

原文JA LLM のコスト最適化には大きく 2 つの軸があります。1 つは「1 クエリで何を読ませるか」= 入力トークンを減らす設計、もう 1 つが本稿で扱う「そもそも検索・生成をするか」= 重い処理の回数を減らす設計です。本稿は後者、「毎回検

#claude #rag #zenn +4

zenn.dev →

og fallback

blog gemini 2mo ago ·

google-developers

AI エージェントを本番運用へ: モノリス分解から得た 5 つの教訓 Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 4月21日 Published Apr 21

AI要約 Google が AI エージェントのプロトタイプを本番運用に耐えるシステムへ刷新した経験から得た 5 つの教訓を紹介。モノリス的な単一エージェントを専門化された複数エージェントに分割し、評価・観測性・状態管理を整備する重要性を説く。

EN Google shares five lessons learned from refactoring a monolithic AI agent prototype into a production-ready system, emphasizing decomposition into specialized sub-agents, robust evaluation, observability, and proper state management.

#agent #google #ai-agents +3

developers.googleblog.com →

Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith

og fallback

#llm-ops 2 total

Entries page 1/1 · 2 total

RAG のコストは『検索回数』で決まる: 毎回検索しないアーキテクチャの設計論 JA RAG のコストは『検索回数』で決まる: 毎回検索しないアーキテクチャの設計論

AI エージェントを本番運用へ: モノリス分解から得た 5 つの教訓 Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith