HomeTags#agents

Tag timeline

#agents 21 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 21
Showing 21
Page 1/1
Updated 1h ago

Entries page 1/1 · 21 total

Wed, Jun 3 1 entries
🔥 HOT changelog copilot 2w ago · github-changelog

GitHub Copilot in Visual Studio Code — 2026年5月リリースまとめ (v1.120〜v1.123) GitHub Copilot in Visual Studio Code, May releases

重要度 High High priority 重要度 High · 変更履歴 · GitHub Copilot High priority · changelog · GitHub Copilot 公開 6月3日 Published Jun 3

AI要約 Visual Studio Code向けGitHub Copilotは2026年5月を通じてv1.120からv1.123まで週次リリースを重ね、Agentsモードの一般提供開始をはじめとする複数の機能強化が行われた。開発者体験のさらなる向上を目指した継続的アップデートの内容をまとめる。

EN VS Code continues with weekly stable releases. This changelog covers releases v1.120 through v1.123, the releases we shipped throughout May and early June 2026. In May, we made the Agents… The post Gi

fallback
Thu, May 28 1 entries
paper research 3w ago · arxiv-cs-ai

LLMが因果発見に失敗する理由と介入エージェントによる解決策 Why LLMs Fail at Causal Discovery and How Interventional Agents Escape

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月28日 Published May 28

AI要約 LLMが因果発見タスクで信頼性に欠ける理由を分析し、介入ベースのエージェントアプローチで課題を克服する方法を提案した論文。

EN arXiv:2605.27567v1 Announce Type: new Abstract: Causal discovery is a cornerstone of scientific reasoning, yet whether large language models can perform it reliably remains an open question. Recent be

Why LLMs Fail at Causal Discovery and How Interventional Agents Escape og fallback
Mon, May 25 1 entries
NEW blog claude 3w ago · anthropic-engineering

製品全体でClaudeを封じ込める方法 How we contain Claude across products

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 5月25日 Published May 25

AI要約 エージェントの能力向上に伴うリスク拡大に対し、Anthropicがclaude.ai・Claude Code・Coworkで実践する封じ込め設計の知見を解説。

EN As agents grow more capable, so does their potential blast radius. The engineering question is how to cap it. Here’s what we’ve learned building containment for claude.ai, Claude Code, and Cowork.

fallback
Sat, May 16 1 entries
release agent-fw 4w ago · langchain-releases

LangChain 1.3.1 リリース、バグ修正中心のパッチ更新 langchain==1.3.1

重要度 Medium Medium priority 重要度 Medium · 公式リリース · Agent Frameworks Medium priority · official release · Agent Frameworks 公開 5月16日 Published May 16

AI要約 LangChainがv1.3.1をリリース。1.3系のマイナーパッチで、エージェント関連の細かな修正や依存関係の調整が中心と見られる。1.3.0で導入された新エージェントAPIの安定化が進む。

EN Changes since langchain==1.3.0 release(langchain): 1.3.1 ( #37454 ) fix(langchain): alias Bedrock providers in summarization token check ( #37453 )

langchain==1.3.1 media fallback
Fri, Apr 24 1 entries
🔥 HOT blog local-llm 1mo ago · huggingface-blog

DeepSeek-V4登場、エージェントが実用可能な100万トークン文脈を実現 DeepSeek-V4: a million-token context that agents can actually use

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 4月24日 Published Apr 24

AI要約 DeepSeek-V4は最大100万トークンの長文コンテキストを扱えるオープンモデルとして公開された。単なる長さの拡張に留まらず、エージェント用途で実際に有効活用できる検索・推論性能を狙った設計が特徴とされる。

EN DeepSeek-V4: a million-token context that agents can actually use

fallback
Fri, Apr 17 1 entries
blog gemini 2mo ago · google-developers

A2UI v0.9公開: フレームワーク非依存な生成UIの新標準 A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 4月17日 Published Apr 17

AI要約 Googleが生成UI向けの新仕様A2UI v0.9を公開した。任意のLLMやフレームワークに依存せず、エージェントが動的UIを記述・配信できる移植性の高いプロトコルを目指す。Web、モバイル、デスクトップ間でUIコンポーネントを共有可能にする。

EN Google has published A2UI v0.9, a portable, framework-agnostic specification for generative UI that lets AI agents describe and deliver dynamic interfaces across web, mobile, and desktop without being tied to a specific LLM or UI framework.

A2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI og fallback
Thu, Apr 16 1 entries
🔥 HOT blog tech-news 2mo ago · aws-news

Amazon BedrockにAnthropicのClaude Opus 4.7モデルが登場 Introducing Anthropic’s Claude Opus 4.7 model in Amazon Bedrock

重要度 High High priority 重要度 High · 技術記事 · Industry & Policy High priority · technical post · Industry & Policy 公開 4月16日 Published Apr 16

AI要約 AWSがAmazon BedrockにClaude Opus 4.7を追加。コーディング、長時間エージェント、専門業務での高性能を実現するAnthropicの最先端Opusモデル。

EN AWS introduces Claude Opus 4.7 in Amazon Bedrock, Anthropic's most capable Opus model targeting coding, long-running agentic tasks, and professional workloads.

fallback
Wed, Apr 8 1 entries
NEW blog claude 2mo ago · anthropic-engineering

Anthropicが解説するManaged Agentsの設計思想 Scaling Managed Agents: Decoupling the brain from the hands

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 4月8日 Published Apr 8

AI要約 Anthropicは、Claudeを基盤とする「Managed Agents」の設計指針を公開した。エージェントを管理する側の視点から、信頼境界、権限委譲、観測性、長時間実行ジョブの扱いなど、本番運用で重要となる要素を整理している。

EN Harnesses encode assumptions that go stale as models improve. Managed Agents-our hosted service for long-horizon agent work-is built around interfaces that stay stable as harnesses change.

fallback
Thu, Apr 2 1 entries
🔥 HOT NEW changelog cursor 2mo ago · cursor-changelog

Cursor 3.0、エージェント中心の新インターフェースを公開 New Cursor Interface

重要度 High High priority 重要度 High · 変更履歴 · AI Editors High priority · changelog · AI Editors 公開 4月2日 Published Apr 2

AI要約 AIコードエディタCursorが3.0をリリースし、UIをエージェント中心の設計に刷新した。複数のAIエージェントを並列に管理・監視できる新ビューを導入し、長時間タスクや自律的なコーディング作業の運用効率を高めることを狙う。

EN Cursor 3 is now available.

fallback
Tue, Mar 17 1 entries
blog local-llm 3mo ago · huggingface-blog

Holotron-12B登場 - 高スループットなコンピュータ操作エージェント Holotron-12B - High Throughput Computer Use Agent

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月17日 Published Mar 17

AI要約 H Companyが12BパラメータのコンピュータUse向けエージェントモデルHolotron-12Bを公開。GUI操作タスクを高スループットで処理し、ブラウザやデスクトップ自動化を想定した設計で、オープンモデルとして提供される。

EN Holotron-12B - High Throughput Computer Use Agent

fallback
Thu, Feb 12 1 entries
blog local-llm 4mo ago · huggingface-blog

OpenEnv実践:実環境でのツール使用エージェント評価 OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月12日 Published Feb 12

AI要約 Hugging FaceがOpenEnvとTuringベンチマークを用いて、実環境でツールを活用するAIエージェントの能力を体系的に評価する手法を解説。

EN OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments

fallback
Fri, Feb 6 1 entries
blog claude 4mo ago · youtube-anthropic

Anthropic、Claude Opus 4.6を発表 Introducing Claude Opus 4.6

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 2月6日 Published Feb 6

AI要約 AnthropicがフラッグシップモデルClaude Opus 4.6を発表した。コーディングやエージェント用途での性能向上が図られ、最上位モデルとして位置付けられる。前世代からの推論能力や実用性の改善が見込まれる。

EN Introducing Claude Opus 4.6

fallback
Tue, Jan 27 1 entries
blog claude 4mo ago · youtube-anthropic

Claudeのツールがインタラクティブに、UI操作が可能に Your tools are now interactive in Claude

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Claude / Claude Code Medium priority · technical post · Claude / Claude Code 公開 1月27日 Published Jan 27

AI要約 Anthropicは、Claude内で利用するツールがインタラクティブに動作するようになったと発表した。ユーザーはチャット内で直接ツールのUIを操作でき、従来のテキスト応答だけでなくボタンやフォームを介した対話が可能になる。

EN Your tools are now interactive in Claude

fallback
Thu, Jan 15 1 entries
🔥 HOT blog local-llm 5mo ago · huggingface-blog

Open Responses: 知っておくべきこと Open Responses: What you need to know

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 1月15日 Published Jan 15

AI要約 Hugging FaceがOpenAIのResponses APIと互換のオープンソース実装「Open Responses」を発表。任意のLLMやMCPツール、ローカルモデルと連携しエージェント開発をベンダーロックインなしで実現。

EN Open Responses: What you need to know

fallback
Wed, Dec 10 1 entries
NEW changelog cursor 6mo ago · cursor-changelog

Cursor 2.2、デバッグモードやマルチエージェント審査機能を追加 Debug Mode, Plan Mode Improvements, Multi-Agent Judging, and Pinned Chats

重要度 Medium Medium priority 重要度 Medium · 変更履歴 · AI Editors Medium priority · changelog · AI Editors 公開 12月10日 Published Dec 10

AI要約 Cursorの最新アップデート2.2では、AIが自律的にバグを特定するデバッグモード、強化されたプランモード、複数エージェントの出力を比較評価するマルチエージェント審査、ピン留めチャットなどが追加された。エージェント駆動開発の実用性向上を狙う改善群となっている。

EN Debug Mode helps you reproduce and fix the most tricky bugs.

fallback
Thu, Nov 13 1 entries
NEW blog gemini 7mo ago · google-deepmind

SIMA 2: 仮想3D世界で推論・学習する Gemini 搭載エージェント SIMA 2: An Agent that Plays, Reasons, and Learns With You in Virtual 3D Worlds

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 11月13日 Published Nov 13

AI要約 Google DeepMind は、Gemini を基盤とする汎用ゲームAIエージェント「SIMA 2」を発表した。前世代と比べ複雑な指示への追従や推論能力が向上し、未学習のゲーム環境でも自己学習を通じてタスクを遂行できるようになった。

EN Introducing SIMA 2, a Gemini-powered AI agent that can think, understand, and take actions in interactive environments.

SIMA 2: An Agent that Plays, Reasons, and Learns With You in Virtual 3D Worlds media fallback
Wed, Oct 29 1 entries
🔥 HOT NEW changelog cursor 7mo ago · cursor-changelog

Cursor 2.0、新コーディングモデルComposerとエージェント中心UIを発表 New Coding Model and Agent Interface

重要度 High High priority 重要度 High · 変更履歴 · AI Editors High priority · changelog · AI Editors 公開 10月29日 Published Oct 29

AI要約 Cursorが2.0をリリース。自社開発の高速コーディングモデル「Composer」と、複数エージェントを並列実行できる新インターフェースを導入した。ブラウザ操作、音声入力、サンドボックス端末、改良コードレビューなども追加され、エージェント駆動開発を本格化させる。

EN Manage agents in our new editor, with a sidebar for your agents and plans.

fallback
Fri, Oct 24 1 entries
🔥 HOT NEW blog gemini 7mo ago · google-deepmind

Gemini 2.5 Computer Useモデルを発表 Introducing the Gemini 2.5 Computer Use model

重要度 High High priority 重要度 High · 技術記事 · Gemini / Gemma High priority · technical post · Gemini / Gemma 公開 10月24日 Published Oct 24

AI要約 Google DeepMindがGemini 2.5 Proベースのコンピュータ操作特化モデルをAPIプレビューで公開。ブラウザやUIを自律操作し、競合より高精度・低遅延を実現。

EN Available in preview via the API, our Computer Use model is a specialized model built on Gemini 2.5 Pro’s capabilities to power agents that can interact with user interfaces.

Introducing the Gemini 2.5 Computer Use model media fallback
Mon, Oct 6 1 entries
🔥 HOT blog codex 8mo ago · openai-blog

OpenAI、AgentKit・新Evals・エージェント向けRFTを発表 Introducing AgentKit, new Evals, and RFT for agents

重要度 High High priority 重要度 High · 技術記事 · OpenAI / Codex High priority · technical post · OpenAI / Codex 公開 10月6日 Published Oct 6

AI要約 OpenAIがエージェント開発を加速する3つの新ツール「AgentKit」「拡張Evals」「エージェント向けRFT」をリリースし、プロトタイプから本番運用までを一貫支援する。

EN Today, we’re releasing new tools to help developers go from prototype to production faster: AgentKit, expanded evals capabilities, and reinforcement fine-tuning for agents.

fallback
Fri, Aug 22 1 entries
NEW changelog cursor 10mo ago · cursor-changelog

Cursor 1.5、Linear連携とAgentターミナル強化、OS通知に対応 Linear integration, improved Agent terminal, and OS notifications

重要度 Medium Medium priority 重要度 Medium · 変更履歴 · AI Editors Medium priority · changelog · AI Editors 公開 8月22日 Published Aug 22

AI要約 Cursor 1.5ではLinearとの統合により課題から直接Agentを起動可能になった。Agentターミナルの動作改善やタスク完了時のOS通知も追加され、長時間タスクの監視性が向上している。

EN You can now start Background Agents directly from Linear. Delegate tasks to Cursor without leaving your issue. We've written a longer blog post with more details.

fallback
Tue, Aug 19 1 entries
release mcp 10mo ago · mcp-servers-releases

MCP公式サーバーリポジトリ 2025.8.18リリース MCP Servers Releases 2025.8.18

重要度 Medium Medium priority 重要度 Medium · 公式リリース · MCP / Tooling Medium priority · official release · MCP / Tooling 公開 8月19日 Published Aug 19

AI要約 Model Context Protocolの公式サーバー集が2025.8.18として更新された。リファレンス実装の整備や軽微な修正が中心で、エコシステムの継続的なメンテナンスを示すリリースと見られる。

EN Release 2025.8.18

MCP Servers Releases 2025.8.18 media fallback