Claude Opus 4.8は4.7と何が違うのか ── 既定の effort と新しくできること JA Claude Opus 4.8は4.7と何が違うのか ── 既定の effort と新しくできること
AI要約 Claude Opus 4.8は4.7に比べ、自分が書いたコードの欠陥を見逃す確率がおよそ4倍低い。 Claude Code preview の dynamic workflows なら、数百の subagent を一度に動かし、数十万行規
Tag timeline
同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。
AI要約 Claude Opus 4.8は4.7に比べ、自分が書いたコードの欠陥を見逃す確率がおよそ4倍低い。 Claude Code preview の dynamic workflows なら、数百の subagent を一度に動かし、数十万行規
AI要約 LLMとModel Context Protocol(MCP)の普及を背景に、APIとのインタラクションを効率化する差分再生成手法DeltaMCPを提案した研究論文。
EN arXiv:2605.28148v1 Announce Type: new Abstract: The rapid development of LLMs coupled with the introduction of Model Context Protocol (MCP) has revolutionized how intelligent agents interact with APIs
AI要約 コード生成だけでなく実際にプレイ可能なゲームを作るため、GUIエージェントを活用した継続的ゲーム生成手法を提案する研究。
EN arXiv:2605.28258v1 Announce Type: new Abstract: Generating a game is not the same as making one that can be played. Despite advances in code generation, existing approaches treat game generation as on
AI要約 自動プロンプトエンジニアリングにコード生成を組み合わせ、オプティマイザ自体をエージェント的に改善するSPEARフレームワークを提案。
EN arXiv:2605.26275v1 Announce Type: new Abstract: Automatic prompt engineering (APE) rewrites prompts to improve downstream task performance, but existing APE loops treat the optimizer itself as a fixed
og fallback AI要約 LLMエージェントがビジュアル仕様からWebアプリを生成する能力を評価するベンチマーク「VISTA」を提案。
EN VISTA is a new benchmark for evaluating LLM-based agents on end-to-end web-app generation from visual specifications.
og fallback AI要約 OpenAIがコーディング特化の新モデル「GPT-5.3-Codex」を公開。エージェント的タスクや長期的な技術作業の性能を強化し、開発者向けに提供開始。
EN GPT-5.3-Codex is a Codex-native agent that pairs frontier coding performance with general reasoning to support long-horizon, real-world technical work.
AI要約 OpenAIがCodex環境向けに最適化したコーディング特化モデルGPT-5.2-Codexを発表。長期推論や大規模コード変換、セキュリティ機能が強化されている。
EN GPT-5.2-Codex is OpenAI’s most advanced coding model, offering long-horizon reasoning, large-scale code transformations, and enhanced cybersecurity capabilities.