HomeTags#latency

Tag timeline

#latency 2 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 2
Showing 2
Page 1/1
Updated 1h ago

Entries page 1/1 · 2 total

Tue, May 26 1 entries
paper research 3w ago · arxiv-cs-ai

LLMを活用したエージェントワークフローの信頼性設計:レイテンシ・信頼性・コストのトレードオフ最適化 Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月26日 Published May 26

AI要約 複数のLLMエージェントが連携するワークフローにおける、レイテンシ・信頼性・コストの三者トレードオフを最適化する設計手法を提案した研究論文。

EN A research paper proposing methods to optimize latency, reliability, and cost tradeoffs in agentic workflows composed of multiple interacting LLM-powered and conventional agents.

Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs og fallback
Wed, Dec 17 1 entries
🔥 HOT NEW blog gemini 6mo ago · google-deepmind

Gemini 3 Flash: 高速性を追求したフロンティアAI Gemini 3 Flash: frontier intelligence built for speed

重要度 High High priority 重要度 High · 技術記事 · Gemini / Gemma High priority · technical post · Gemini / Gemma 公開 12月17日 Published Dec 17

AI要約 Google DeepMindは、軽量かつ高速なフロンティアモデル「Gemini 3 Flash」を発表した。推論や マルチモーダル性能を維持しつつ、低レイテンシと高スループットを実現し、リアルタイム用途や大規模展開に最適化されている。

EN Gemini 3 Flash offers frontier intelligence built for speed at a fraction of the cost.

Gemini 3 Flash: frontier intelligence built for speed media fallback