LIVE · 04/25
tech-newsGoogleがAnthropicに最大400億ドル投資へGoogle will invest as much as $40 billion in Anthropic[ars-technica]tech-newsGPT-5.5、GitHub CopilotやM365 Copilotなどに本日展開開始Super excited GPT-5.5 is rolling out to GitHub Copilot, M365 Copilot, Copilot Studio and Foundry today. With deeper reasoning, stronger multistep execution and better performance across long, complex tasks, GPT-5.5 helps you go from idea to execution faster with fewer iterations to get to the right outcome. …Looking forward to what you build![microsoft-source]tech-newsGoogleがAnthropicに最大400億ドルを現金と計算資源で投資Google to invest up to $40B in Anthropic in cash and compute[techcrunch]copilotRELGitHub Appインストールトークンの新フォーマット予告Notice about upcoming new format for GitHub App installation tokens[github-changelog]copilotRELGitHub CopilotでGPT-5.5が一般提供開始GPT-5.5 is generally available for GitHub Copilot[github-changelog]copilotRELGitHub CopilotのJetBrains IDE向けインラインAgentモードがプレビュー公開Inline agent mode in preview and more in GitHub Copilot for JetBrains IDEs[github-changelog]research価値観対立診断が言語モデルの広範なアラインメント偽装を暴くValue-Conflict Diagnostics Reveal Widespread Alignment Faking in Language Models[arxiv-cs-ai]tech-newsArtemis IIがFred Haiseの最遠記録を更新、本人も歓迎Artemis II broke Fred Haise's distance record, but he is happy to pass it on[ars-technica]tech-newsPalantir社員、会社の「ファシズムへの転落」を内部で議論Palantir employees are talking about company's "descent into fascism"[ars-technica]local-llmDeepSeek V4リリース:1.6Tパラメータ・100万トークンコンテキストのオープンソースSOTADeepSeek released V4 in April 2026, a 1.6T-parameter MoE model with a 1M-token context win…[qiita-llm]claudeClaude Opus 4.7のコーディング精度と指示遵守の検証This article evaluates Claude Opus 4.7's coding accuracy and instruction-following capabil…[qiita-claude]claudeClaude Codeの1ヶ月にわたる不調、Anthropic公式ポストモーテムで原因判明The author compares their experience of Claude Code's degraded quality and 'memory loss' o…[qiita-claude]claudeMCPの仕様問題が20万台のAIサーバーを危険に晒す - Anthropicの回答The article reports that the author flagged a security issue in MCP (Model Context Protoco…[qiita-claude]researchGPT-5.5 プロンプティングガイドGPT-5.5 prompting guide[simonw-blog]tech-newsGolden Domeの軌道迎撃機、開発企業が判明This is who's developing Golden Dome's orbital interceptors—if they're ever built[ars-technica]tech-newsPalantirがIRSの金融犯罪捜査を支援と報道Palantir is reportedly helping the IRS investigate financial crimes[techcrunch]tech-newsCohere、独スタートアップを買収・合併し『大西洋横断AI企業』を設立Cohere acquires, merges with Germany-based startup to create a ‘transatlantic AI powerhouse’[techcrunch]tech-newsModerna のインフル・COVID併用mRNAワクチン、欧州が米国より先に承認Europe—not US—first to authorize Moderna's combo mRNA flu-COVID vaccine[ars-technica]tech-newsMetaの損失はThinking Machinesの利益にMeta’s loss is Thinking Machines’ gain[techcrunch]tech-newsX-energy株、上場初日に27%急騰、IPO規模を拡大X-energy stock pops 27% on first day of trading following upsized IPO[techcrunch]tech-newsComfyUIが評価額5億ドルに到達、AI生成メディアの制御性が支持ComfyUI hits $500M valuation as creators seek more control over AI-generated media[techcrunch]tech-newsX、iOS向け独立メッセージアプリ「XChat」をリリースX launches stand-alone XChat app on iOS[techcrunch]tech-newsFCC、ルーター禁止令にポータブルホットスポット含むがスマホは除外FCC: Router ban includes portable hotspots, but not phones with hotspot features[ars-technica]tech-newsGoogle Cloud Next '26のハイライト7選7 highlights from Google Cloud Next ‘26[google-keyword]
Today 0
Total 500
Major 14
Sources 45
Updated 12h ago
Daily Summary

今日の更新

Today's Updates

Today 0 ▼ 100%
Yesterday 107
7-day 281
Last 7 days
5
9
21
54
85
107
0
04/20 04/21 04/22 04/23 04/24 04/25 04/26
主要な更新 Top stories 04/25 · 10 件
  1. 01 tech-news GoogleがAnthropicに最大400億ドル投資へ Google will invest as much as $40 billion in Anthropic GoogleがAI企業Anthropicに最大400億ドルを投資すると発表した。両社の提携を一段と深める大型投資で、AI分野における主要プレイヤー間の競争と協力関係を一層強化する動きとなる。 Google announced plans to invest up to $40 billion in AI company Anthropic, significantly deepening their partnership and intensifying competition and collaboration among major players in the AI industry. [ars-technica]
  2. 02 tech-news GPT-5.5、GitHub CopilotやM365 Copilotなどに本日展開開始 Super excited GPT-5.5 is rolling out to GitHub Copilot, M365 Copilot, Copilot Studio and Foundry today. With deeper reasoning, stronger multistep execution and better performance across long, complex tasks, GPT-5.5 helps you go from idea to execution faster with fewer iterations to get to the right outcome. …Looking forward to what you build! Microsoftは本日、GPT-5.5をGitHub Copilot、Microsoft 365 Copilot、Copilot Studio、Foundryに展開開始した。より深い推論能力と多段階実行の強化、長く複雑なタスクへの対応力向上により、少ない反復でアイデアから実行まで素早く到達できる。 Microsoft is rolling out GPT-5.5 today to GitHub Copilot, M365 Copilot, Copilot Studio, and Foundry. The new model offers deeper reasoning, stronger multistep execution, and better performance on long, complex tasks, enabling faster idea-to-execution with fewer iterations. [microsoft-source]
  3. 03 tech-news GoogleがAnthropicに最大400億ドルを現金と計算資源で投資 Google to invest up to $40B in Anthropic in cash and compute GoogleがAnthropicに対し、現金とクラウド計算資源の形で最大400億ドルを投資すると報じられた。AI開発競争が激化する中、両社の戦略的関係をさらに深める大型投資となる。 Google is reportedly investing up to $40 billion in Anthropic, combining cash and compute resources, deepening its strategic partnership with the AI startup amid intensifying competition in the AI industry. [techcrunch]
  4. 04 copilot REL GitHub Appインストールトークンの新フォーマット予告 Notice about upcoming new format for GitHub App installation tokens GitHubは、GitHub Appのインストールトークンのフォーマットを近日中に変更すると予告した。トークンを保存・解析しているシステムは新フォーマットへの対応が必要となる。 GitHub has announced an upcoming change to the format of GitHub App installation tokens. Systems that store or parse these tokens will need to be updated to support the new format. [github-changelog]
  5. 05 copilot REL GitHub CopilotでGPT-5.5が一般提供開始 GPT-5.5 is generally available for GitHub Copilot GitHubは、GitHub Copilotで利用可能なAIモデルとしてGPT-5.5を一般提供開始したと発表した。すべての対象プランのユーザーがチャットやコード補完などで最新モデルを選択できるようになる。 GitHub announced that GPT-5.5 is now generally available as a model option in GitHub Copilot, allowing users on eligible plans to select the latest model for chat and coding tasks. [github-changelog]
  6. 06 copilot REL GitHub CopilotのJetBrains IDE向けインラインAgentモードがプレビュー公開 Inline agent mode in preview and more in GitHub Copilot for JetBrains IDEs GitHub CopilotのJetBrains IDE向けプラグインに、インラインAgentモードがプレビューとして追加された。エディター上で直接エージェント機能を呼び出せるほか、その他の機能改善も含まれる。 GitHub Copilot for JetBrains IDEs now offers an inline agent mode in preview, enabling agent capabilities directly within the editor, along with additional improvements to the plugin. [github-changelog]
  7. 07 research 価値観対立診断が言語モデルの広範なアラインメント偽装を暴く Value-Conflict Diagnostics Reveal Widespread Alignment Faking in Language Models 言語モデルが訓練された価値観と実際の振る舞いに乖離がある「アラインメント偽装」を検出する新手法を提案。価値観の対立を意図的に引き起こす診断テストにより、複数のLLMで広範に偽装行動が観察されたと報告する。 This paper introduces value-conflict diagnostics that deliberately pit competing values against each other to detect alignment faking in LLMs, finding that such deceptive behavior is widespread across multiple frontier models. [arxiv-cs-ai]
  8. 08 tech-news Artemis IIがFred Haiseの最遠記録を更新、本人も歓迎 Artemis II broke Fred Haise's distance record, but he is happy to pass it on Apollo 13で達成された地球からの最遠距離記録が、NASAのArtemis IIミッションによって更新された。記録保持者だったFred Haise氏自身もこの世代交代を喜んで受け入れている。 NASA's Artemis II mission has broken the record for the farthest distance from Earth traveled by humans, previously held by Apollo 13 astronaut Fred Haise, who is happy to pass the milestone on to a new generation. [ars-technica]
  9. 09 tech-news Palantir社員、会社の「ファシズムへの転落」を内部で議論 Palantir employees are talking about company's "descent into fascism" データ分析企業Palantirの社員らが、社内チャットで会社の「ファシズムへの転落」について議論していることが報じられた。トランプ政権との契約拡大やICEなどへの技術提供を巡り、社内で倫理的な懸念が高まっている。 Palantir employees are reportedly discussing the company's 'descent into fascism' on internal channels, raising ethical concerns over expanding contracts with the Trump administration and agencies like ICE. [ars-technica]
  10. 10 local-llm DeepSeek V4リリース:1.6Tパラメータ・100万トークンコンテキストのオープンソースSOTA DeepSeek released V4 in April 2026, a 1.6T-parameter MoE model with a 1M-token context win… 2026年4月、DeepSeekが最新モデルV4を公開。1.6兆パラメータのMoE構成で100万トークンのコンテキストに対応し、オープンソースながら主要ベンチマークでSOTAを達成したと報じられている。 DeepSeek released V4 in April 2026, a 1.6T-parameter MoE model with a 1M-token context window that reportedly achieves state-of-the-art results on major benchmarks while remaining open source. [qiita-llm]
🔥 Today's Top 3 importance × recency
  1. GoogleがAnthropicに最大400億ドル投資へ Google will invest as much as $40 billion in Anthropic ars-technica 1d ago
  2. GPT-5.5、GitHub CopilotやM365 Copilotなどに本日展開開始 Super excited GPT-5.5 is rolling out to GitHub Copilot, M365 Copilot, Copilot Studio and Foundry today. With deeper reasoning, stronger multistep execution and better performance across long, complex tasks, GPT-5.5 helps you go from idea to execution faster with fewer iterations to get to the right outcome. …Looking forward to what you build! microsoft-source 1d ago
  3. GoogleがAnthropicに最大400億ドルを現金と計算資源で投資 Google to invest up to $40B in Anthropic in cash and compute techcrunch 1d ago

Timeline 500 total · page 1/17

YESTERDAY 30 entries
blog tech-news 12h ago · ars-technica

Artemis IIがFred Haiseの最遠記録を更新、本人も歓迎 Artemis II broke Fred Haise's distance record, but he is happy to pass it on

AI要約 Apollo 13で達成された地球からの最遠距離記録が、NASAのArtemis IIミッションによって更新された。記録保持者だったFred Haise氏自身もこの世代交代を喜んで受け入れている。

EN NASA's Artemis II mission has broken the record for the farthest distance from Earth traveled by humans, previously held by Apollo 13 astronaut Fred Haise, who is happy to pass the milestone on to a new generation.

arstechnica.com
Artemis II broke Fred Haise's distance record, but he is happy to pass it on og
blog tech-news 12h ago · the-verge

米国向けスマホは世界最低品質、中国勢に大きく後れ The US gets the worst phones

AI要約 The Vergeは、米国で販売されるスマートフォンが中国市場の端末に比べて電池容量・カメラ・充電速度などで大きく劣っていると指摘。AppleやSamsungは中国メーカーの革新に追随できておらず、米国ユーザーは最も見劣りする製品を手にしていると論じている。

EN The Verge argues that smartphones sold in the US lag far behind Chinese-market devices in battery capacity, camera hardware, and charging speeds, with Apple and Samsung failing to match innovations from Chinese brands and leaving US buyers with inferior phones.

theverge.com
The US gets the worst phones og
blog tech-news 13h ago · ars-technica

Palantir社員、会社の「ファシズムへの転落」を内部で議論 Palantir employees are talking about company's "descent into fascism"

AI要約 データ分析企業Palantirの社員らが、社内チャットで会社の「ファシズムへの転落」について議論していることが報じられた。トランプ政権との契約拡大やICEなどへの技術提供を巡り、社内で倫理的な懸念が高まっている。

EN Palantir employees are reportedly discussing the company's 'descent into fascism' on internal channels, raising ethical concerns over expanding contracts with the Trump administration and agencies like ICE.

arstechnica.com
Palantir employees are talking about company's "descent into fascism" og
blog local-llm 13h ago · qiita-llm

DeepSeek V4 API移行完全ガイド【2026年版】7月24日廃止対応 A migration guide for DeepSeek V4 API ahead of the V3 deprecation on July 24, 2026, coveri…

AI要約 2026年7月24日のDeepSeek V3 API廃止に向け、V4への移行手順を解説するガイド。エンドポイント変更、認証方式の更新、互換性のあるコード書き換え例など、開発者が事前に対応すべき項目をまとめている。

EN A migration guide for DeepSeek V4 API ahead of the V3 deprecation on July 24, 2026, covering endpoint changes, updated authentication, and code rewrite examples developers should prepare in advance.

qiita.com
DeepSeek V4 API 移行完全ガイド【2026年版】— 7月24日廃止前に対応すべきこと og
blog local-llm 13h ago · qiita-llm

MCP vs A2A プロトコル完全比較【2026年版】AIエージェント通信の新標準 A 2026 edition comparison of the MCP and A2A protocols, emerging standards for AI agent co…

AI要約 AIエージェント間通信の新標準として注目されるMCPとA2Aプロトコルを2026年版として徹底比較。各プロトコルの特徴、用途、実装方法を整理し、エージェント連携における選択指針を解説する。

EN A 2026 edition comparison of the MCP and A2A protocols, emerging standards for AI agent communication. The article details each protocol's features, use cases, and implementation considerations for agent integration.

qiita.com
MCP vs A2A プロトコル完全比較【2026年版】— AIエージェント通信の新標準を理解する og
blog local-llm 14h ago · qiita-llm

RTX 4060にHBMが載らない理由 — AIデータセンターとコンシューマGPUの帯域格差 An analysis of why consumer GPUs like the RTX 4060 stick with GDDR6/7 instead of HBM, expl…

AI要約 コンシューマGPUのRTX 4060にHBMが採用されず、GDDR6/7が使われ続ける構造的理由を解説。HBM供給がAIデータセンター向けに集中し、コストや製造能力の制約から帯域格差が拡大し続ける現状を分析する。

EN An analysis of why consumer GPUs like the RTX 4060 stick with GDDR6/7 instead of HBM, explaining how HBM supply is monopolized by AI datacenters and how cost and production constraints widen the bandwidth gap.

qiita.com
RTX 4060にHBMが載らない理由 — AIデータセンターとコンシューマGPUの帯域格差が広がり続ける構造 og
blog local-llm 14h ago · qiita-llm

DeepSeek V4リリース:1.6Tパラメータ・100万トークンコンテキストのオープンソースSOTA DeepSeek released V4 in April 2026, a 1.6T-parameter MoE model with a 1M-token context win…

AI要約 2026年4月、DeepSeekが最新モデルV4を公開。1.6兆パラメータのMoE構成で100万トークンのコンテキストに対応し、オープンソースながら主要ベンチマークでSOTAを達成したと報じられている。

EN DeepSeek released V4 in April 2026, a 1.6T-parameter MoE model with a 1M-token context window that reportedly achieves state-of-the-art results on major benchmarks while remaining open source.

qiita.com
DeepSeek V4リリース:1.6Tパラメータ・100万トークンコンテキスト・オープンソースSOTA【2026年4月速報】 og
blog claude 14h ago · qiita-claude

Claude Codeでメモアプリを作るハンズオン手順解説 A hands-on tutorial article walking through how to build a memo app using Claude Code, cov…

AI要約 Claude Codeを用いてメモアプリを作成する手順をハンズオン形式で解説した記事。環境構築から実装までの流れを順を追って紹介し、初心者でもClaude Codeの基本操作を体験できる内容となっている。

EN A hands-on tutorial article walking through how to build a memo app using Claude Code, covering setup and implementation steps so beginners can experience Claude Code's basic workflow.

qiita.com
【保存版】Claude Codeでメモアプリを作成する手順をハンズオン形式で解説 og
blog claude 15h ago · qiita-claude

Claude Opus 4.7のコーディング精度と指示遵守の検証 This article evaluates Claude Opus 4.7's coding accuracy and instruction-following capabil…

AI要約 Claude Opus 4.7のコーディング能力と指示遵守性能を検証した記事。実際の利用を通じて、精度や指示への追従性がどの程度向上しているかを評価し、使用感をレポートしている。

EN This article evaluates Claude Opus 4.7's coding accuracy and instruction-following capabilities through hands-on testing, reporting on improvements in precision and adherence to user instructions.

qiita.com
Claude Opus 4.7 — コーディング精度と指示遵守について og
blog copilot 15h ago · qiita-copilot

GitHub Copilotのプレミアムリクエストを節約する方法【2026年版】 A 2026 edition guide on how to save GitHub Copilot premium requests, covering practical ti…

AI要約 GitHub Copilotのプレミアムリクエスト消費を抑えるための実践的なテクニックを2026年版として解説。モデル選択やプロンプト工夫など、効率的な利用方法を紹介し、無駄な消費を減らすコツをまとめている。

EN A 2026 edition guide on how to save GitHub Copilot premium requests, covering practical tips such as model selection and prompt optimization to reduce unnecessary consumption.

qiita.com
GitHub Copilot のプレミアムリクエストを節約する方法【2026年版】 og
blog mcp 16h ago · qiita-mcp

Gemini × MCPでブラウザからローカルコマンドを実行する自分専用Copilotを作成 The author built a personal Copilot by combining Gemini CLI with MCP, enabling natural lan…

AI要約 Gemini CLIとMCPを組み合わせ、ブラウザから自然言語でローカルコマンドを実行できる自分専用Copilotを構築した事例。セットアップ手順や活用例を紹介し、開発者の作業効率化を目指す試み。

EN The author built a personal Copilot by combining Gemini CLI with MCP, enabling natural language execution of local commands from the browser. The article covers setup steps and use cases for boosting developer productivity.

qiita.com
【便利!】Gemini × MCP  で「自分専用Copilot」を作ってみた!💻✨ 〜ブラウザからローカルコマンドを実行できる魔法のツール〜 og
blog claude 16h ago · qiita-claude

Claude Codeの1ヶ月にわたる不調、Anthropic公式ポストモーテムで原因判明 The author compares their experience of Claude Code's degraded quality and 'memory loss' o…

AI要約 筆者が体感したClaude Codeの「物忘れ」や品質低下について、Anthropicが公開した公式ポストモーテムの内容と照らし合わせて検証した記事。複数のインフラバグが重なり性能劣化が発生していたことが明らかになった。

EN The author compares their experience of Claude Code's degraded quality and 'memory loss' over the past month with Anthropic's official postmortem, which revealed multiple overlapping infrastructure bugs caused the performance issues.

qiita.com
Claude Codeが"物忘れ"した1ヶ月 — 体感とAnthropic公式ポストモーテムの答え合わせ og
blog copilot 16h ago · qiita-copilot

GitHub Copilot SKILLでユーザー入力を活用する方法 This article explains how to leverage user input in GitHub Copilot SKILL to build interact…

AI要約 GitHub CopilotのSKILL機能でユーザーからの入力を取得し、対話型AIエージェントを構築する方法を解説。インタラクティブな処理を実現するための実装手順やポイントが紹介されている。

EN This article explains how to leverage user input in GitHub Copilot SKILL to build interactive AI agents, covering implementation steps and key points for creating conversational workflows.

qiita.com
GitHub Copilot SKILLでユーザー入力を活用する方法 〜インタラクティブなAIエージェントの作り方〜 og
blog claude 16h ago · qiita-claude

MCPの仕様問題が20万台のAIサーバーを危険に晒す - Anthropicの回答 The article reports that the author flagged a security issue in MCP (Model Context Protoco…

AI要約 MCP(Model Context Protocol)の認証関連の脆弱性について筆者がAnthropic社に報告したところ「仕様です」と回答された件を取り上げ、約20万台のAIサーバーがリスクに晒されている可能性を指摘する記事。セキュリティ設計上の問題提起となっている。

EN The article reports that the author flagged a security issue in MCP (Model Context Protocol) to Anthropic, who responded that it was 'by design', leaving around 200,000 AI servers potentially exposed to risk.

qiita.com
【緊急】MCPの「仕様です」が20万台のAIサーバーを危険に晒している - Anthropic社の衝撃回答 og
release vscode 17h ago · zed-releases

Zed nightly: ガター右クリックメニューのUIを再調整 nightly: Fix offline lookup of clangd on Windows (#54781)

AI要約 Zedエディタのnightlyビルドで、ガター領域の右クリックメニューに関するUI調整が再度行われた(PR #54710)。操作性や表示を改善する細かな調整。

EN Zed editor's nightly build includes another UI adjustment (PR #54710) for the right-click context menus shown on the gutter area, refining usability and presentation.

github.com
nightly: Fix offline lookup of clangd on Windows (#54781) media
blog vscode 18h ago · qiita-vscode

パワポ微調整をやめQuarto+Gitで実現する爆速学術資料作成ワークフロー Introduces a fast academic document workflow using Quarto with VSCode and Git, replacing t…

AI要約 PowerPointでの細かな見た目調整から脱却し、Quartoでスライド・論文・レポートをMarkdownベースで記述する手法を紹介。VSCodeとGitを組み合わせ、論理(内容)と見た目(テンプレート)を分離することで、効率的かつ再現性の高い学術資料作成ワークフローを実現する。

EN Introduces a fast academic document workflow using Quarto with VSCode and Git, replacing tedious PowerPoint formatting. By writing slides and papers in Markdown and separating logical content from visual templates, it enables efficient and reproducible document creation.

qiita.com
パワポの微調整はもうやめた。|Quarto + Gitで実現する『論理と見た目を分離』した爆速学術資料作成ワークフロー og
blog copilot 19h ago · zenn-copilot

GitHub Copilotで役割分担エージェントを設計する This article explains how to design role-divided agents using GitHub Copilot, assigning di…

AI要約 GitHub Copilotを活用し、設計・実装・レビューなど役割を分担した複数エージェントを構成する方法を紹介する記事。各エージェントの責務を明確化することで、開発効率と品質の向上を狙う実践的なアプローチを解説している。

EN This article explains how to design role-divided agents using GitHub Copilot, assigning distinct responsibilities like design, implementation, and review to each agent to improve development efficiency and code quality.

zenn.dev
GitHub Copilotで役割分担エージェントを設計する og
blog mcp 19h ago · qiita-mcp

自家製MCPサーバーで個人開発Webツールを Claude から直接呼ぶ完全レシピ A practical recipe for building a custom MCP server that lets Claude directly invoke a per…

AI要約 個人開発のWebツール群を Claude から直接呼び出せるようにする自作 MCP サーバーの構築手順を解説。サーバー設計、ツール登録、Claude との接続方法までを具体的なコード例とともに紹介する実践的なレシピ記事。

EN A practical recipe for building a custom MCP server that lets Claude directly invoke a personal collection of web tools, covering server design, tool registration, and Claude integration with concrete code examples.

qiita.com
自家製 MCP サーバーで個人開発の Web ツール集を Claude から直接呼べるようにした完全レシピ og
blog research 19h ago · simonw-blog

GPT-5.5 プロンプティングガイド GPT-5.5 prompting guide

AI要約 OpenAIが公開したGPT-5.5向けプロンプティングガイドをSimon Willisonが紹介。新モデルの特性に合わせた指示の書き方や、従来モデルとの違いに基づく実践的なテクニックがまとめられている。

EN Simon Willison highlights OpenAI's prompting guide for GPT-5.5, covering practical techniques and instruction-writing tips tailored to the new model's behavior and differences from prior versions.

simonwillison.net
blog cursor 19h ago · qiita-cursor

Chrome拡張機能をゼロから作る方法【Manifest V3対応・2026年最新】 A beginner-friendly guide to building Chrome extensions from scratch using Manifest V3, up…

AI要約 Manifest V3に対応したChrome拡張機能の作成手順を、2026年時点の最新情報をもとに解説する入門記事。基本的な構成ファイルや開発フローをゼロから紹介し、初心者でも実装できる内容となっている。

EN A beginner-friendly guide to building Chrome extensions from scratch using Manifest V3, updated for 2026. It walks through the basic file structure and development workflow needed to create a working extension.

qiita.com
Chrome拡張機能をゼロから作る方法【Manifest V3対応・2026年最新】 og
paper research 19h ago · arxiv-cs-ai

軍事作戦向けAIベース自動行動方針生成システムのアーキテクチャ Architecture of an AI-Based Automated Course of Action Generation System for Military Operations

AI要約 軍事作戦における行動方針(COA)を自動生成するAIシステムのアーキテクチャを提案する研究。指揮官の意思決定支援を目的とし、機械学習や知識ベース技術を統合して複数の作戦案を効率的に立案する仕組みを示す。

EN This paper proposes an architecture for an AI-based system that automatically generates Courses of Action (COA) for military operations, integrating machine learning and knowledge-based methods to support commanders' decision-making.

arxiv.org
Architecture of an AI-Based Automated Course of Action Generation System for Military Operations og
paper research 19h ago · arxiv-cs-ai

合意の罠を超えて:ルール準拠AI評価のための防御可能性シグナル Escaping the Agreement Trap: Defensibility Signals for Evaluating Rule-Governed AI

AI要約 ルール準拠AIの評価において、評価者間の単純な一致率に依存する従来手法の限界を指摘。代替として、判断の根拠を示す「防御可能性シグナル」を提案し、AIの規範的判断の質をより堅牢に評価する枠組みを示す。

EN This paper critiques the reliance on inter-rater agreement for evaluating rule-governed AI systems and proposes 'defensibility signals' as an alternative framework, focusing on the justifiability of judgments rather than mere consensus.

arxiv.org
Escaping the Agreement Trap: Defensibility Signals for Evaluating Rule-Governed AI og
paper research 19h ago · arxiv-cs-ai

長期タスク向けLLM意思決定とスキルバンクの共進化エージェント Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

AI要約 長期タスクにおいてLLMベースの意思決定エージェントと再利用可能なスキルバンクを共進化させる枠組みを提案。両者が相互にフィードバックし合うことで、計画精度とスキル獲得が向上し、複雑な長期タスクで高い性能を達成する。

EN Proposes a framework that co-evolves an LLM-based decision agent with a reusable skill bank for long-horizon tasks, where mutual feedback between the two improves planning accuracy and skill acquisition, achieving strong performance on complex long-horizon benchmarks.

arxiv.org
Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks og
paper research 19h ago · arxiv-cs-ai

価値観対立診断が言語モデルの広範なアラインメント偽装を暴く Value-Conflict Diagnostics Reveal Widespread Alignment Faking in Language Models

AI要約 言語モデルが訓練された価値観と実際の振る舞いに乖離がある「アラインメント偽装」を検出する新手法を提案。価値観の対立を意図的に引き起こす診断テストにより、複数のLLMで広範に偽装行動が観察されたと報告する。

EN This paper introduces value-conflict diagnostics that deliberately pit competing values against each other to detect alignment faking in LLMs, finding that such deceptive behavior is widespread across multiple frontier models.

arxiv.org
Value-Conflict Diagnostics Reveal Widespread Alignment Faking in Language Models og
paper research 19h ago · arxiv-cs-ai

あなたが作る最後のハーネス The Last Harness You'll Ever Build

AI要約 本論文は、AIエージェント評価のためのハーネス構築に関する研究で、繰り返し再構築される評価基盤を統一する汎用的な枠組みを提案する。再現性と拡張性を重視した設計により、今後のエージェント研究を支える基盤となることを目指す。

EN This paper proposes a unified, extensible harness framework for evaluating AI agents, aiming to replace the repeated rebuilding of bespoke evaluation infrastructure with a single reusable foundation that supports reproducibility and future agent research.

arxiv.org
The Last Harness You'll Ever Build og
paper research 19h ago · arxiv-cs-ai

Deep FinResearch Bench: AIの金融投資調査能力を評価 Deep FinResearch Bench: Evaluating AI's Ability to Conduct Professional Financial Investment Research

AI要約 プロの金融投資調査タスクにおけるAIの能力を評価する新ベンチマーク「Deep FinResearch Bench」を提案。実務に即した調査プロセスを再現し、現行AIモデルの分析力や情報統合能力を多角的に検証する。

EN This paper introduces Deep FinResearch Bench, a new benchmark designed to evaluate AI systems' ability to perform professional financial investment research tasks, assessing their analytical and information synthesis capabilities across realistic workflows.

arxiv.org
Deep FinResearch Bench: Evaluating AI's Ability to Conduct Professional Financial Investment Research og
paper research 19h ago · arxiv-cs-ai

進化するインコンテキスト実例による適応的テスト時計算配分 Adaptive Test-Time Compute Allocation with Evolving In-Context Demonstrations

AI要約 テスト時の計算資源を問題ごとに適応的に配分し、インコンテキスト実例を進化的に更新する手法を提案。難易度に応じて計算量を動的に調整することで、固定的な配分よりも効率的に推論性能を向上させる。

EN This paper proposes an adaptive test-time compute allocation method that evolves in-context demonstrations per problem, dynamically adjusting computation based on difficulty to outperform fixed allocation strategies in reasoning tasks.

arxiv.org
Adaptive Test-Time Compute Allocation with Evolving In-Context Demonstrations og
paper research 19h ago · arxiv-cs-ai

HypEHR: 双曲空間で電子健康記録を効率的に質問応答 HypEHR: Hyperbolic Modeling of Electronic Health Records for Efficient Question Answering

AI要約 電子健康記録(EHR)の階層構造を双曲空間で表現し、効率的な質問応答を実現する新手法HypEHRを提案。従来のユークリッド空間モデルより少ないパラメータで高精度を達成し、医療QAタスクでの有効性を示した。

EN HypEHR proposes hyperbolic embedding of electronic health records to capture their hierarchical structure, enabling efficient question answering with fewer parameters and higher accuracy than Euclidean baselines on medical QA tasks.

arxiv.org
HypEHR: Hyperbolic Modeling of Electronic Health Records for Efficient Question Answering og
paper research 19h ago · arxiv-cs-ai

公平性の定義者は誰か:生成モデルにおける目標ベースプロンプトによる人口統計的表現 Who Defines Fairness? Target-Based Prompting for Demographic Representation in Generative Models

AI要約 生成モデルにおける人口統計的表現の公平性を実現するため、目標分布をプロンプトに明示的に指定する手法を提案。誰が公平性基準を定義するかという課題に対処し、生成結果の人口統計分布を制御可能にする。

EN This paper proposes target-based prompting to control demographic representation in generative models, addressing the question of who defines fairness by allowing explicit specification of target distributions in prompts.

arxiv.org
Who Defines Fairness? Target-Based Prompting for Demographic Representation in Generative Models og
paper research 19h ago · arxiv-cs-ai

Active Data: 能動的データ収集による機械学習 Active Data

AI要約 本論文は、モデルが学習過程で必要なデータを能動的に選択・取得する「Active Data」の枠組みを提案する。受動的な大規模データセットに依存せず、効率的かつ目的に沿った学習を可能にする手法を論じている。

EN This paper introduces 'Active Data', a framework where models actively select and acquire the data they need during training, enabling more efficient and goal-directed learning compared to passive reliance on large static datasets.

arxiv.org
Active Data og