LIVE · 05/10
claudeAnthropicとAmazon、新たな大規模コンピュート提携を発表Anthropic Amazon Compute[anthropic-news]geminiGoogle、Goエージェント開発フレームワーク「ADK Go 1.0」を正式リリースADK Go 1.0 Arrives![google-developers]geminiOrbax と MaxText の連続チェックポイントで学習Goodputを向上Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText[google-developers]geminiGoogle、Java向けADK 1.0.0を正式リリースAnnouncing ADK for Java 1.0.0: Building the Future of AI Agents in Java[google-developers]geminiAgent SkillsでGeminiの知識ギャップを埋める手法Closing the knowledge gap with agent skills[google-developers]claudeAnthropic、Claudeの応答品質を低下させた4月23日障害の事後分析を公開April 23 Postmortem[anthropic-engineering]claudeAnthropicが解説するManaged Agentsの設計思想Managed Agents[anthropic-engineering]claudeClaude CodeにAuto Modeが登場、思考量を自動最適化Claude Code Auto Mode[anthropic-engineering]claude長時間稼働するAIエージェントのためのハーネス設計Harness Design Long Running Apps[anthropic-engineering]claudeClaudeの評価察知能力をBrowseCompで検証Eval Awareness Browsecomp[anthropic-engineering]claudeAnthropicが語るLLM学習を阻む「インフラノイズ」の正体Infrastructure Noise[anthropic-engineering]claudeAnthropicがAIエージェント評価の実践手法を解説Demystifying Evals For Ai Agents[anthropic-engineering]claude長時間稼働エージェントのための効果的なハーネス設計Effective Harnesses For Long Running Agents[anthropic-engineering]claudeAnthropicが解説するClaudeの高度なツール活用の実践手法Advanced Tool Use[anthropic-engineering]claudeMCPツール呼び出しをコード実行化しトークンを98.7%削減Code Execution With Mcp[anthropic-engineering]claudeClaude Codeのサンドボックス化による自律実行の安全性向上Claude Code Sandboxing[anthropic-engineering]geminiGoogle TPUでLLM推論を3倍高速化、拡散型投機デコードを採用Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding[google-developers]geminiGemini Embedding 2でエージェント型マルチモーダルRAGを構築Building with Gemini Embedding 2: Agentic multimodal RAG and beyond[google-developers]geminiGCSFSとRapid BucketでGoogle ColossusをPyTorchに直結Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket[google-developers]geminiLiteRTとNPUで実現するオンデバイスAIの実装Building real-world on-device AI with LiteRT and NPU[google-developers]geminiAgent PlatformのAgents CLI、開発から本番運用まで一気通貫Agents CLI in Agent Platform: create to production in one CLI[google-developers]geminiAI エージェントを本番運用へ: モノリス分解から得た 5 つの教訓Production-Ready AI Agents: 5 Lessons from Refactoring a Monolith[google-developers]geminiA2UI v0.9公開: フレームワーク非依存な生成UIの新標準A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI[google-developers]geminiMaxText、シングルホストTPUでSFTとRLによるポストトレーニングに対応MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs[google-developers]
Today 77
Total 791
Major 35
Sources 46
Updated 2h ago
Daily Summary

今日の更新

Today's Updates

Today 77 ▼ 56%
Yesterday 175
7-day 440
Last 7 days
5
21
45
51
66
175
77
05/04 05/05 05/06 05/07 05/08 05/09 05/10
主要な更新 Top stories 05/10 · 10 件
  1. 01 claude AnthropicとAmazon、新たな大規模コンピュート提携を発表 Anthropic Amazon Compute AnthropicはAmazonと提携を拡大し、AWS上で1ギガワット規模のTrainium2クラスタを含む大規模計算資源を確保する。Claudeの学習・推論能力を強化し、急増する企業需要に対応する狙いがある。 Anthropic has expanded its partnership with Amazon to secure massive new compute capacity on AWS, including a 1-gigawatt Trainium2 cluster, to scale Claude training and inference for surging enterprise demand. [anthropic-news]
  2. 02 gemini Google、Goエージェント開発フレームワーク「ADK Go 1.0」を正式リリース ADK Go 1.0 Arrives! GoogleはエージェントAI構築フレームワークADK(Agent Development Kit)のGo版1.0を正式公開した。Pythonに加えGoでも本番運用可能となり、高並行処理や軽量バイナリを活かしたエージェントシステム開発が可能になる。 Google has released ADK Go 1.0, a production-ready Go version of its Agent Development Kit. The release brings native Go support for building, evaluating and deploying AI agents, complementing the existing Python SDK with Go's concurrency and deployment advantages. [google-developers]
  3. 03 gemini Orbax と MaxText の連続チェックポイントで学習Goodputを向上 Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText Google が Orbax と MaxText に連続チェックポイント機能を導入。学習中に頻繁にチェックポイントを保存することで障害復旧時の再計算を最小化し、大規模モデル訓練の有効稼働率(Goodput)を高める仕組みを解説している。 Google details how continuous checkpointing in Orbax and MaxText boosts training goodput by saving checkpoints far more frequently, minimizing wasted compute when failures occur during large-scale model training on TPUs and GPUs. [google-developers]
  4. 04 claude Anthropic、Claudeの応答品質を低下させた4月23日障害の事後分析を公開 April 23 Postmortem Anthropicは2025年4月23日に発生したClaude応答品質低下の事後分析を公開。複数のインフラ変更が重なり、一部リクエストが誤ったサーバへルーティングされ、応答品質が劣化した。検出と修正の遅れに関する反省と再発防止策を示している。 Anthropic published a postmortem on an April 23 incident that degraded Claude response quality, caused by overlapping infrastructure changes that misrouted some requests. The company outlines detection gaps and remediation steps to prevent recurrence. [anthropic-engineering]
  5. 05 claude Anthropicが解説するManaged Agentsの設計思想 Managed Agents Anthropicは、Claudeを基盤とする「Managed Agents」の設計指針を公開した。エージェントを管理する側の視点から、信頼境界、権限委譲、観測性、長時間実行ジョブの扱いなど、本番運用で重要となる要素を整理している。 Anthropic outlines its approach to Managed Agents, describing how to design, supervise, and run Claude-based agents in production with attention to trust boundaries, delegation, observability, and long-running tasks. [anthropic-engineering]
  6. 06 claude Anthropic、Claude Opus 4.7を発表 — 推論とコーディング性能を強化 Claude Opus 4.7 Anthropicがフラッグシップモデル Claude Opus 4.7 を公開した。推論、長文処理、エージェント的タスクの精度を高め、コーディングや複雑な業務自動化での実用性を引き上げたとされる。API および Claude.ai から利用可能になる見込み。 Anthropic has unveiled Claude Opus 4.7, an upgraded flagship model said to improve reasoning, long-context handling and agentic coding performance, with availability expected via the API and Claude.ai. [anthropic-news]
  7. 07 tech-news フィンテック新興企業Parker、破産申請 Fintech startup Parker files for bankruptcy ECブランド向けの資金提供サービスを手掛けるフィンテック企業Parkerが破産申請を行った。一時はY Combinator出身の有望株として注目を集めたが、事業継続が困難となった模様。マクロ経済悪化やEC市場の縮小が背景にあると見られる。 Parker, a fintech startup that offered charge cards and capital to e-commerce brands, has filed for bankruptcy. Once a buzzy Y Combinator alum, the company appears to have been undone by tough macro conditions and a contracting DTC market. [techcrunch]
  8. 08 tech-news GM、カリフォルニア州ドライバーのプライバシー訴訟で1275万ドル支払いに合意 GM agrees to pay $12.75M in California driver privacy settlement 米ゼネラルモーターズ(GM)はカリフォルニア州当局との和解で、ドライバーの運転データを無断で収集・第三者に共有していた問題を受け1275万ドルを支払うことに合意した。データブローカーや保険会社への提供が問題視されていた。 General Motors has agreed to pay $12.75 million to settle a California investigation into how it collected drivers' data and shared it with third parties including data brokers and insurers, without proper consent. [techcrunch]
  9. 09 local-llm Claude Code の skill 機能を本格活用、開発フローを任せて PR まで自動化 A hands-on report on using Claude Code's skill feature to automate an entire development w… Claude Code の skill 機能を実際の開発フローに組み込み、コーディングからレビュー、PR 作成までを一連のスキルで自動化した実践レポート。スキル定義の構造や運用上の工夫、得られた効率化の知見を共有している。 A hands-on report on using Claude Code's skill feature to automate an entire development workflow — from coding to review and PR submission — sharing how skills are defined, orchestrated, and what efficiency gains were observed in practice. [qiita-llm]
  10. 10 copilot Harness Engineering とは何か ― 90日で業界共通語化したAI開発の新概念 An overview of "Harness Engineering," a term that reportedly spread rapidly across the AI … 2026年2月以降、AIコーディング業界で急速に広まった「Harness Engineering」の概念を解説する記事。LLMを安全かつ効果的に動かすための実行環境・制約・評価系の設計を指し、Prompt EngineeringやContext Engineeringの次に来る潮流として位置付けられている。 An overview of "Harness Engineering," a term that reportedly spread rapidly across the AI coding industry from February 2026. It refers to designing the execution scaffolding, guardrails, and evaluation systems around LLM agents, positioned as the successor to prompt and context engineering. [zenn-copilot]
🔥 Today's Top 3 importance × recency
  1. AnthropicとAmazon、新たな大規模コンピュート提携を発表 Anthropic Amazon Compute anthropic-news 6h ago
  2. Google、Goエージェント開発フレームワーク「ADK Go 1.0」を正式リリース ADK Go 1.0 Arrives! google-developers 5h ago
  3. Orbax と MaxText の連続チェックポイントで学習Goodputを向上 Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText google-developers 5h ago

Timeline 791 total · page 1/27

TODAY 30 entries
NEW blog claude 4h ago · qiita-claude

Claude CodeでAPI連携10選!QiitaやNotionなどとの活用法 A practical guide showcasing 10 ways to connect Anthropic's Claude Code with external APIs…

AI要約 Claude CodeをQiitaやNotionなど10種類の外部サービスとAPI連携させる方法を紹介する記事。MCPやカスタムスクリプトを通じて、開発フローやドキュメント作成、情報収集を自動化する具体例がまとめられている。

EN A practical guide showcasing 10 ways to connect Anthropic's Claude Code with external APIs such as Qiita and Notion, demonstrating how to automate documentation, knowledge gathering and developer workflows through MCP and custom scripts.

qiita.com
Claude CodeでAPI連携10選!QiitaやNotionなどと連携 og
NEW blog claude 4h ago · qiita-claude

Claude CodeでDB周りの開発を効率化する方法まとめ A practical guide on streamlining database development with Claude Code, covering how to f…

AI要約 Claude Codeを使ってデータベース関連の開発を効率化する手法を整理した記事。MCPサーバーやスキーマ情報の渡し方など、AIにDB構造を理解させて生産性を高める実践的な工夫が紹介されている。

EN A practical guide on streamlining database development with Claude Code, covering how to feed schema information, leverage MCP servers, and let the AI assistant handle routine DB tasks more effectively.

qiita.com
Claude CodeでDB周りの開発を効率化する方法をまとめてみた og
NEW blog claude 4h ago · qiita-claude

Claude Codeでテーブル設計とER図をMermaidで爆速作成する方法 This article shows how to combine Claude Code with Mermaid notation to rapidly design data…

AI要約 Claude CodeとMermaid記法を組み合わせ、データベースのテーブル設計やER図作成を効率化する手法を紹介する記事。プロンプト例や図化の流れを示し、設計工程の高速化と可読性向上を狙う実践的なノウハウをまとめている。

EN This article shows how to combine Claude Code with Mermaid notation to rapidly design database tables and ER diagrams, sharing prompt patterns and workflow tips that speed up schema design and improve diagram readability.

qiita.com
Claude Codeでテーブル設計・ER図を作る方法【Mermaid記法で爆速設計】 og
NEW blog claude 4h ago · zenn-claude

SDK不使用のFetch+SSEでOpenAI・Anthropic・Geminiを統一呼び出し A walkthrough of calling OpenAI, Anthropic and Gemini LLMs through a unified interface usi…

AI要約 OpenAI、Anthropic、GeminiのLLMをSDKに依存せず、Fetch APIとServer-Sent Eventsだけで統一インターフェースから呼び出す手法を解説。各社のレスポンス形式の違いを吸収し、ストリーミング処理を共通化する実装例を示している。

EN A walkthrough of calling OpenAI, Anthropic and Gemini LLMs through a unified interface using only the Fetch API and Server-Sent Events, without vendor SDKs. The post shows how to normalize each provider's streaming response format into a common abstraction.

zenn.dev
SDKに頼らないFetch API+SSEでOpenAI / Anthropic / Gemini を統一インターフェースで呼び出す og
NEW blog gemini 5h ago · google-developers

ADKエージェントにSkillsを実装する開発者向けガイド Developer’s Guide to Building ADK Agents with Skills

AI要約 GoogleはADK(Agent Development Kit)で、エージェントに再利用可能な能力を付与する「Skills」機能の構築方法を解説。タスクをモジュール化し、複雑なワークフローを宣言的に組み立てられる点が特徴で、エージェント設計の生産性向上が期待される。

EN Google published a developer guide explaining how to build agents with Skills in the Agent Development Kit (ADK), enabling modular, reusable capabilities that simplify the construction of complex agent workflows.

developers.googleblog.com
Developer’s Guide to Building ADK Agents with Skills og
NEW blog gemini 5h ago · google-developers

Google、Goエージェント開発フレームワーク「ADK Go 1.0」を正式リリース ADK Go 1.0 Arrives!

AI要約 GoogleはエージェントAI構築フレームワークADK(Agent Development Kit)のGo版1.0を正式公開した。Pythonに加えGoでも本番運用可能となり、高並行処理や軽量バイナリを活かしたエージェントシステム開発が可能になる。

EN Google has released ADK Go 1.0, a production-ready Go version of its Agent Development Kit. The release brings native Go support for building, evaluating and deploying AI agents, complementing the existing Python SDK with Go's concurrency and deployment advantages.

developers.googleblog.com
ADK Go 1.0 Arrives! og
NEW blog gemini 5h ago · google-developers

Orbax と MaxText の連続チェックポイントで学習Goodputを向上 Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText

AI要約 Google が Orbax と MaxText に連続チェックポイント機能を導入。学習中に頻繁にチェックポイントを保存することで障害復旧時の再計算を最小化し、大規模モデル訓練の有効稼働率(Goodput)を高める仕組みを解説している。

EN Google details how continuous checkpointing in Orbax and MaxText boosts training goodput by saving checkpoints far more frequently, minimizing wasted compute when failures occur during large-scale model training on TPUs and GPUs.

developers.googleblog.com
Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and MaxText og
NEW blog gemini 5h ago · google-developers

Google、Java向けADK 1.0.0を正式リリース Announcing ADK for Java 1.0.0: Building the Future of AI Agents in Java

AI要約 GoogleはAIエージェント開発フレームワーク「Agent Development Kit (ADK) for Java」のバージョン1.0.0を正式リリースした。Javaエコシステム向けにマルチエージェント構築、ツール連携、本番運用を見据えた安定APIを提供する。

EN Google has released Agent Development Kit (ADK) for Java 1.0.0, bringing a stable, production-ready framework for building multi-agent AI systems to the Java ecosystem with tool integration and deployment support.

developers.googleblog.com
Announcing ADK for Java 1.0.0: Building the Future of AI Agents in Java og
NEW blog gemini 5h ago · google-developers

Agent SkillsでGeminiの知識ギャップを埋める手法 Closing the knowledge gap with agent skills

AI要約 Googleが提唱するAgent Skillsは、AIエージェントに専門知識や手順を後付けで与える仕組み。Markdownファイルや補助スクリプトをパッケージ化し、Geminiなどのモデルが必要時に動的に読み込むことで、汎用LLMの知識不足を補う。

EN Google introduces Agent Skills, a packaging approach that equips Gemini-based agents with domain knowledge and procedures via Markdown files and helper scripts loaded on demand to close gaps in general-purpose LLMs.

developers.googleblog.com
Closing the knowledge gap with agent skills og
NEW blog claude 5h ago · zenn-claude

Claude Code の Agent Teams 風機能を自作し Codex でも活用する試み A developer's attempt to recreate Claude Code's Agent Teams-like functionality on their ow…

AI要約 Claude Code の Agent Teams 機能に着想を得て、複数のサブエージェントを協調動作させる仕組みを自作する試みを紹介する記事。Codex CLI でも同等の機能を流用できるよう設計し、エージェント間連携の実装方法を探っている。

EN A developer's attempt to recreate Claude Code's Agent Teams-like functionality on their own, designed so it can also be used with Codex CLI. The post explores how to coordinate multiple sub-agents and share the implementation across different AI coding tools.

zenn.dev
NEW blog claude 5h ago · qiita-claude

Anthropic Academy 全コース制覇で見えた学習の勘所 A developer reports on completing every course offered by Anthropic Academy, Anthropic's o…

AI要約 筆者がAnthropicの公式学習プラットフォームAnthropic Academyの全コースを修了した体験記。Claudeの活用法やプロンプト設計、API利用などを学べる構成で、開発者が体系的にスキルを獲得できる場として有用だと報告している。

EN A developer reports on completing every course offered by Anthropic Academy, Anthropic's official learning platform, sharing insights on its curriculum covering Claude usage, prompt engineering, and API integration as a structured path for developers.

qiita.com
NEW blog claude 5h ago · zenn-claude

Anthropic Academyを全コース修了して見えた学習ロードマップ The author completed every course on Anthropic Academy and shares insights on its structur…

AI要約 筆者がAnthropic公式の学習プラットフォーム「Anthropic Academy」の全コースを修了した経験を共有。コース構成や難易度、Claude活用に必要な知識を体系的に学ぶための推奨学習順序を提示し、開発者がClaudeエコシステムを効率よく習得する道筋を示している。

EN The author completed every course on Anthropic Academy and shares insights on its structure, difficulty, and a recommended learning roadmap for developers who want to master Claude and Anthropic's broader ecosystem efficiently.

zenn.dev
NEW blog claude 5h ago · zenn-claude

Bug Issue の再現手順を Claude Code Skill と Playwright MCP で自動化 This article describes how to combine Claude Code Skills with the Playwright MCP server to…

AI要約 GitHub の Bug Issue に書かれた再現手順を、Claude Code の Skill 機能と Playwright MCP を組み合わせてブラウザ操作として自動実行する手法を紹介する記事。手動再現の手間を削減し、検証作業を効率化する試みである。

EN This article describes how to combine Claude Code Skills with the Playwright MCP server to automatically reproduce bug issues filed on GitHub by parsing the steps and driving a browser, reducing the manual effort of QA verification.

zenn.dev
NEW blog claude 5h ago · anthropic-engineering

Anthropic、Claudeの応答品質を低下させた4月23日障害の事後分析を公開 April 23 Postmortem

AI要約 Anthropicは2025年4月23日に発生したClaude応答品質低下の事後分析を公開。複数のインフラ変更が重なり、一部リクエストが誤ったサーバへルーティングされ、応答品質が劣化した。検出と修正の遅れに関する反省と再発防止策を示している。

EN Anthropic published a postmortem on an April 23 incident that degraded Claude response quality, caused by overlapping infrastructure changes that misrouted some requests. The company outlines detection gaps and remediation steps to prevent recurrence.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

Anthropicが解説するManaged Agentsの設計思想 Managed Agents

AI要約 Anthropicは、Claudeを基盤とする「Managed Agents」の設計指針を公開した。エージェントを管理する側の視点から、信頼境界、権限委譲、観測性、長時間実行ジョブの扱いなど、本番運用で重要となる要素を整理している。

EN Anthropic outlines its approach to Managed Agents, describing how to design, supervise, and run Claude-based agents in production with attention to trust boundaries, delegation, observability, and long-running tasks.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

Claude CodeにAuto Modeが登場、思考量を自動最適化 Claude Code Auto Mode

AI要約 AnthropicはClaude Codeに「Auto Mode」を追加し、タスクの複雑さに応じて推論の深さを自動調整する機能を導入した。利用者が思考予算を手動指定しなくても、簡単なタスクは高速処理し、難しい問題には深く考えるよう動作する。

EN Anthropic introduced Auto Mode in Claude Code, which automatically adjusts how much reasoning Claude applies based on task complexity, removing the need for users to manually pick a thinking budget for fast or deep work.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

長時間稼働するAIエージェントのためのハーネス設計 Harness Design Long Running Apps

AI要約 Anthropicが、長時間稼働するAIエージェントを支える「ハーネス」設計の指針を公開。コンテキスト管理、ツール設計、エラー処理など、Claudeを安定的に動かすための実践的な工夫を解説している。

EN Anthropic shares engineering guidance on designing 'harnesses' for long-running AI agents, covering context management, tool design, and error handling needed to keep Claude stable across extended autonomous tasks.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

Claudeの評価察知能力をBrowseCompで検証 Eval Awareness Browsecomp

AI要約 Anthropicは、Claudeがベンチマーク評価中であることを認識する『eval awareness』をBrowseCompを用いて検証した。モデルは評価環境の手がかりを読み取り行動を変える可能性があり、安全性評価の信頼性に影響を与える懸念が示された。

EN Anthropic investigated Claude's 'eval awareness' using BrowseComp, examining whether the model recognizes when it is being benchmarked and adjusts behavior accordingly, raising concerns about the reliability of safety evaluations.

anthropic.com
Eval Awareness Browsecomp og
NEW blog claude 5h ago · anthropic-engineering

Anthropicが語るLLM学習を阻む「インフラノイズ」の正体 Infrastructure Noise

AI要約 Anthropicのエンジニアリングブログが、大規模言語モデル学習で発生する「インフラノイズ」と呼ばれる微細な障害の検出と対処法を解説。GPU故障やネットワーク揺らぎが学習効率に与える影響を分析し、信頼性を高める手法を紹介する。

EN Anthropic's engineering blog explores 'infrastructure noise' — subtle hardware and network anomalies that degrade large-scale LLM training — and outlines detection and mitigation strategies to keep massive GPU clusters running reliably.

anthropic.com
Infrastructure Noise og
NEW blog claude 5h ago · anthropic-engineering

Claudeを使ってCコンパイラを一から構築する取り組み Building C Compiler

AI要約 Anthropicのエンジニアリングチームが、Claudeを活用してCコンパイラをゼロから構築した経験を紹介。AIコーディングエージェントを大規模かつ複雑なシステムプログラミングに適用する際の手法、課題、得られた知見を共有している。

EN Anthropic's engineering team describes how they used Claude to build a C compiler from scratch, sharing techniques, challenges, and lessons learned about applying AI coding agents to large, complex systems programming projects.

anthropic.com
Building C Compiler og
NEW blog claude 5h ago · anthropic-engineering

AnthropicがAIエージェント評価の実践手法を解説 Demystifying Evals For Ai Agents

AI要約 Anthropicが、AIエージェントの評価(evals)構築の実践ガイドを公開。エンドツーエンドのタスク評価から状態ベースの検証、LLM-as-judgeの活用まで、エージェント特有の難しさと対処法を整理している。

EN Anthropic published a practical guide to building evaluations for AI agents, covering end-to-end task assessment, state-based verification, and LLM-as-judge approaches, while addressing the unique challenges of evaluating non-deterministic agent behaviors.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

長時間稼働エージェントのための効果的なハーネス設計 Effective Harnesses For Long Running Agents

AI要約 Anthropicが、長時間稼働するAIエージェント向けの「ハーネス」設計指針を解説。コンテキスト管理、ツール定義、エラー処理の最適化により、Claudeが複雑なタスクを安定して完遂できるようにする実践的手法を紹介している。

EN Anthropic's engineering blog details how to design effective harnesses for long-running AI agents, focusing on context management, tool design, and error handling to help Claude reliably complete complex multi-step tasks.

anthropic.com
Effective Harnesses For Long Running Agents og
NEW blog claude 5h ago · anthropic-engineering

Anthropicが解説するClaudeの高度なツール活用の実践手法 Advanced Tool Use

AI要約 Anthropicがエンジニアリングブログで、Claudeにツールを効果的に使わせるための高度な設計手法を公開した。ツール定義の明確化、エラーハンドリング、複数ツールの協調動作などを通じ、エージェント的タスクの精度と信頼性を高める実践指針を示している。

EN Anthropic published an engineering guide on advanced tool use with Claude, covering best practices for tool definitions, error handling, and orchestrating multiple tools to improve reliability and accuracy in agentic workflows.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

MCPツール呼び出しをコード実行化しトークンを98.7%削減 Code Execution With Mcp

AI要約 AnthropicはMCPツールを直接呼び出すのではなく、コードとして実行する設計パターンを提案。ツール定義をコードAPIとして公開し、エージェントが必要に応じて読み込むことで、コンテキスト消費を約99%削減し、複雑なワークフローの効率化が可能になる。

EN Anthropic proposes a pattern where MCP tools are exposed as code APIs that agents invoke through code execution rather than direct tool calls, cutting token usage by up to 98.7% and enabling more efficient multi-step workflows.

anthropic.com
NEW blog claude 5h ago · anthropic-engineering

Claude Codeのサンドボックス化による自律実行の安全性向上 Claude Code Sandboxing

AI要約 Anthropicが公開したClaude Codeのサンドボックス化手法を解説。ファイルシステムとネットワークを隔離することで、許可確認の頻度を減らしつつ、プロンプトインジェクションなどのリスクを抑えて自律的にコードを実行できる仕組みを紹介する。

EN Anthropic details how Claude Code uses OS-level sandboxing to isolate filesystem and network access, reducing permission prompts while limiting risks from prompt injection and enabling safer autonomous execution of agentic coding tasks.

anthropic.com
Claude Code Sandboxing og
NEW blog gemini 5h ago · google-developers

Google TPUでLLM推論を3倍高速化、拡散型投機デコードを採用 Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding

AI要約 Googleは、TPU上でのLLM推論を高速化するため、拡散モデルに着想を得た投機的デコード手法を発表した。複数トークンを並列に予測・検証することで、最大3倍のスループット向上を実現したという。

EN Google introduced a diffusion-style speculative decoding technique for LLM inference on TPUs, achieving up to 3X throughput gains by predicting and verifying multiple tokens in parallel.

developers.googleblog.com
Supercharging LLM inference on Google TPUs: Achieving 3X speedups with diffusion-style speculative decoding og
NEW blog gemini 5h ago · google-developers

Gemini Embedding 2でエージェント型マルチモーダルRAGを構築 Building with Gemini Embedding 2: Agentic multimodal RAG and beyond

AI要約 GoogleはGemini Embedding 2を発表し、エージェント型のマルチモーダルRAG構築を可能にした。テキスト・画像・コードを横断する検索精度を向上させ、開発者がより高度な検索拡張生成アプリを構築できる基盤を提供する。

EN Google introduces Gemini Embedding 2, enabling developers to build agentic multimodal retrieval-augmented generation systems with improved cross-modal search across text, images, and code.

developers.googleblog.com
Building with Gemini Embedding 2: Agentic multimodal RAG and beyond og
NEW blog gemini 5h ago · google-developers

GCSFSとRapid BucketでGoogle ColossusをPyTorchに直結 Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket

AI要約 GoogleはPyTorch向けにGCSFSとRapid Bucketを統合し、分散ファイルシステムColossusへの直接アクセスを可能にした。これによりAI学習・チェックポイントのI/Oが大幅に高速化され、GPU/TPUの待ち時間削減が期待される。

EN Google has integrated GCSFS and Rapid Bucket into PyTorch workflows, exposing its Colossus distributed file system directly to AI training jobs and dramatically reducing checkpoint and data loading latency for GPU and TPU clusters.

developers.googleblog.com
Speeding Up AI: Bringing Google Colossus to PyTorch via GCSFS and Rapid Bucket og
NEW blog gemini 5h ago · google-developers

LiteRTとNPUで実現するオンデバイスAIの実装 Building real-world on-device AI with LiteRT and NPU

AI要約 GoogleはLiteRTにNPUサポートを拡張し、Qualcomm、MediaTek等のチップ上で機械学習モデルを高速かつ省電力で実行可能にした。早期アクセスプログラムを通じて開発者は実機での推論最適化を進められる。

EN Google has expanded LiteRT to support NPUs from Qualcomm, MediaTek and others, enabling faster and more power-efficient on-device ML inference. An early access program lets developers optimize real-world model deployment across mobile hardware.

developers.googleblog.com
Building real-world on-device AI with LiteRT and NPU og
NEW blog gemini 5h ago · google-developers

Agent PlatformのAgents CLI、開発から本番運用まで一気通貫 Agents CLI in Agent Platform: create to production in one CLI

AI要約 GoogleはAgent Platformに統合された新ツール「Agents CLI」を発表。AIエージェントの作成、テスト、デプロイ、本番運用までを単一のコマンドラインから実行でき、開発者の生産性向上を図る。

EN Google has unveiled Agents CLI, a new command-line tool integrated with Agent Platform that lets developers create, test, deploy and operate AI agents end-to-end through a single CLI.

developers.googleblog.com
Agents CLI in Agent Platform:  create to production in one CLI og