LIVE · 04/28
tech-newsOpenAI、Microsoftとの独占パートナーシップを解消OpenAI ends its exclusive partnership with Microsoft[ars-technica]tech-newsDeepMindのDavid Silver、人間データ不要のAI開発に11億ドルを調達DeepMind’s David Silver just raised $1.1B to build an AI that learns without human data[techcrunch]tech-newsMicrosoftとOpenAIの著名なAGI条項が消滅Microsoft and OpenAI’s famed AGI agreement is dead[the-verge]agent-fwRELpython-1.41.3python-1.41.3[semantic-kernel-releases]copilotRELGitHub Copilotコードレビュー、2026年6月1日からGitHub Actions分を消費へGitHub Copilot code review will start consuming GitHub Actions minutes on June 1, 2026[github-changelog]researchpip 26.1の新機能:ロックファイルと依存関係クールダウンWhat's new in pip 26.1 - lockfiles and dependency cooldowns![simonw-blog]copilotCopilot Pro が月300回制限からトークン課金へ—GPT-5.4×Copilot CLI の実コスト試算GitHub Copilot Pro is shifting from a 300 monthly premium-request cap to token-based meter…[zenn-copilot]tech-newsインドのSnabbit、5600万ドル調達 オンデマンド家事代行に投資家注目India’s Snabbit closes $56M round as investor interest in on-demand home services heats up[techcrunch]tech-newsOutlookにAgent Mode登場、Copilotがメールと予定を自動管理Agent Mode is here in Outlook! Copilot can now help run your inbox and calendar, triaging emails, rescheduling meetings and helping you stay on top of what matters most. Now available in our Frontier early access program.[microsoft-source]copilot2026年6月1日よりGitHub Copilotの年間プラン提供が終了GitHub announced that annual subscription plans for GitHub Copilot will be discontinued on…[qiita-copilot]tech-newsNASAのArtemis III月面着陸ミッション、打ち上げは早くても2027年末に延期Put it in pencil: NASA's Artemis III mission will launch no earlier than late 2027[ars-technica]copilotGitHub Copilotプレミアムリクエストの課金体系が変更へThis article reports that GitHub Copilot's premium request billing system is changing, end…[qiita-copilot]tech-newsGoogleがYouTubeでAIチャットボット検索を試験導入Google is testing AI chatbot search for YouTube[the-verge]researchMicrosoft VibeVoice: 長尺対話音声を生成するオープンモデルmicrosoft/VibeVoice[simonw-blog]tech-news月間100万DLの人気OSSパッケージが認証情報を窃取Open source package with 1 million monthly downloads stole user credentials[ars-technica]tech-newsCanonical、UbuntuへのAI機能導入計画を発表Canonical lays out a plan for AI in Ubuntu Linux[the-verge]tech-newsMuskとAltmanが法廷対決、OpenAIの未来を左右する裁判へMusk and Altman face off in trial that will determine OpenAI's future[ars-technica]tech-newsEUがGoogleにAndroidのAIアシスタント開放を要求、Googleは反発EU tells Google to open up AI on Android; Google says that's "unwarranted intervention"[ars-technica]researchOpenAIとMicrosoftのAGI条項の歴史をたどるTracking the history of the now-deceased OpenAI Microsoft AGI clause[simonw-blog]tech-newsオリジナル開発者による現代向けSNESエミュレータ「Super ZSNES」登場"Super ZSNES" is a stab at a modern SNES emulator from the original developers[ars-technica]tech-newsGoogle従業員、Pichai CEOに機密軍事AI利用拒否を要請Google employees ask Sundar Pichai to say no to classified military AI use[the-verge]tech-news米中AI対立深まる中、中国がMetaによるManus買収を阻止China kills Meta’s acquisition of Manus as US-China AI rivalry deepens[ars-technica]tech-newsMicrosoft Copilot Studioにリアルタイム音声エージェント、Dynamics 365にも新エージェント追加Microsoft Copilot Studio introduces real-time voice agents while Dynamics 365 adds new agents[microsoft-source]tech-newsOpenAI、Amazonとの500億ドル契約でMicrosoftの法的障害を解消OpenAI ends Microsoft legal peril over its $50B Amazon deal[techcrunch]
Today 148
Total 500
Major 24
Sources 42
Updated just now
Daily Summary

今日の更新

Today's Updates

Today 148 ▲ 72%
Yesterday 86
7-day 367
Last 7 days
9
39
38
30
17
86
148
04/22 04/23 04/24 04/25 04/26 04/27 04/28
主要な更新 Top stories 04/28 · 10 件
  1. 01 tech-news OpenAI、Microsoftとの独占パートナーシップを解消 OpenAI ends its exclusive partnership with Microsoft OpenAIはMicrosoftとの独占的なクラウドパートナーシップを終了し、他のクラウドプロバイダーとも提携できるようになった。Microsoftはこの変更に同意し、AI業界の競争環境に大きな影響を与える可能性がある。 OpenAI has ended its exclusive cloud partnership with Microsoft, gaining the freedom to work with other cloud providers. Microsoft agreed to the change, marking a significant shift in the AI industry's competitive landscape. [ars-technica]
  2. 02 tech-news DeepMindのDavid Silver、人間データ不要のAI開発に11億ドルを調達 DeepMind’s David Silver just raised $1.1B to build an AI that learns without human data DeepMindでAlphaGoを率いたDavid Silverが、人間のデータに依存せず自律的に学習するAIの開発を目指し、11億ドルの資金調達を実施した。強化学習を軸に、経験から学ぶ次世代AI研究を推進する新会社を立ち上げる。 David Silver, the DeepMind researcher behind AlphaGo, has raised $1.1 billion to launch a new venture building AI systems that learn autonomously from experience rather than relying on human-generated data, with reinforcement learning at the core. [techcrunch]
  3. 03 tech-news MicrosoftとOpenAIの著名なAGI条項が消滅 Microsoft and OpenAI’s famed AGI agreement is dead MicrosoftとOpenAIは契約を再交渉し、AGI達成時にMicrosoftのアクセスを終了させる有名な条項を撤廃した。これによりOpenAIの営利化への道が開かれ、両社の関係も新たな段階に入る。 Microsoft and OpenAI have renegotiated their contract, scrapping the famous AGI clause that would have cut off Microsoft's access once AGI was achieved, paving the way for OpenAI's restructuring into a for-profit entity. [the-verge]
  4. 04 agent-fw REL python-1.41.3 python-1.41.3 What's Changed Python: Add field and table name escaping for python SqlServer connector by @westey-m in #13893 Python: Extend InMemoryCollection filter attribute blocklist by @moonbox3 in #13897 Pytho [semantic-kernel-releases]
  5. 05 copilot REL GitHub Copilotコードレビュー、2026年6月1日からGitHub Actions分を消費へ GitHub Copilot code review will start consuming GitHub Actions minutes on June 1, 2026 GitHubは、Copilotのコードレビュー機能が2026年6月1日からGitHub Actionsの実行時間(分)を消費するようになると発表した。これまで無償だった利用が課金対象となり、組織や利用者は今後コスト管理を見直す必要がある。 GitHub announced that Copilot code review will begin consuming GitHub Actions minutes starting June 1, 2026, shifting the feature from free usage to a metered model that organizations will need to factor into their cost planning. [github-changelog]
  6. 06 research pip 26.1の新機能:ロックファイルと依存関係クールダウン What's new in pip 26.1 - lockfiles and dependency cooldowns! pip 26.1がリリースされ、PEP 751準拠のロックファイル生成と、新しすぎるパッケージのインストールを避ける依存関係クールダウン機能が追加された。サプライチェーン攻撃への対策として有用な機能となる。 pip 26.1 has been released, introducing PEP 751-compliant lockfile generation and a new dependency cooldown feature that avoids installing packages released too recently, helping mitigate supply chain attacks. [simonw-blog]
  7. 07 copilot Copilot Pro が月300回制限からトークン課金へ—GPT-5.4×Copilot CLI の実コスト試算 GitHub Copilot Pro is shifting from a 300 monthly premium-request cap to token-based meter… GitHub Copilot Pro の課金体系が月300回のプレミアムリクエスト制から従量トークン課金へ移行。記事ではGPT-5.4とCopilot CLIを使った実利用での実コストを試算し、新旧プランの損益分岐点を検証している。 GitHub Copilot Pro is shifting from a 300 monthly premium-request cap to token-based metered billing. The article estimates real-world costs of using GPT-5.4 with Copilot CLI and analyzes the break-even point between the old and new pricing. [zenn-copilot]
  8. 08 tech-news インドのSnabbit、5600万ドル調達 オンデマンド家事代行に投資家注目 India’s Snabbit closes $56M round as investor interest in on-demand home services heats up インドのオンデマンド家事代行サービスSnabbitが5600万ドルの資金調達ラウンドを完了した。同分野への投資家の関心が高まる中、サービス拡大を加速する狙い。掃除や料理などの即時対応型家事サービスを提供している。 Indian on-demand home services startup Snabbit has closed a $56M funding round amid growing investor interest in the sector. The company plans to expand its rapid-response household services like cleaning and cooking. [techcrunch]
  9. 09 tech-news OutlookにAgent Mode登場、Copilotがメールと予定を自動管理 Agent Mode is here in Outlook! Copilot can now help run your inbox and calendar, triaging emails, rescheduling meetings and helping you stay on top of what matters most. Now available in our Frontier early access program. MicrosoftはOutlook向けにAgent Modeを発表した。Copilotが受信トレイを自動でトリアージし、会議のリスケジュールや重要案件の優先付けを支援する。現在Frontier早期アクセスプログラムで利用可能。 Microsoft has launched Agent Mode in Outlook, enabling Copilot to triage emails, reschedule meetings, and help users prioritize what matters most in their inbox and calendar. It's now available via the Frontier early access program. [microsoft-source]
  10. 10 copilot 2026年6月1日よりGitHub Copilotの年間プラン提供が終了 GitHub announced that annual subscription plans for GitHub Copilot will be discontinued on… GitHubは2026年6月1日をもってGitHub Copilotの年間プラン提供を終了すると発表した。既存契約者は更新時に月額プランへ移行する必要があり、料金体系や支払い方法の見直しが求められる。 GitHub announced that annual subscription plans for GitHub Copilot will be discontinued on June 1, 2026. Existing annual subscribers will need to switch to monthly billing upon renewal, requiring users to reconsider their payment plans. [qiita-copilot]
🔥 Today's Top 3 importance × recency
  1. OpenAI、Microsoftとの独占パートナーシップを解消 OpenAI ends its exclusive partnership with Microsoft ars-technica 12h ago
  2. DeepMindのDavid Silver、人間データ不要のAI開発に11億ドルを調達 DeepMind’s David Silver just raised $1.1B to build an AI that learns without human data techcrunch 15h ago
  3. MicrosoftとOpenAIの著名なAGI条項が消滅 Microsoft and OpenAI’s famed AGI agreement is dead the-verge 16h ago

Timeline 500 total · page 1/17

TODAY 30 entries
NEW blog tech-news 1m ago · the-verge

SF作品が豊作の今、見逃せない一作『Aphelion』 It’s a busy time for sci-fi, but don’t miss Aphelion

AI要約 SF作品が次々登場する中、新作ゲーム『Aphelion』はSteam・PS5・Xbox向けに登場し、注目に値する佳作としてThe Vergeが紹介。雰囲気あるSF体験が高く評価されている。

EN Amid a busy season for sci-fi releases, The Verge highlights Aphelion, a new sci-fi game on Steam, PS5, and Xbox, as a standout title worth checking out for fans of atmospheric science fiction experiences.

theverge.com
It’s a busy time for sci-fi, but don’t miss Aphelion og
NEW blog local-llm 1h ago · qiita-llm

1800ファイル・5アプリ連携・1万行超でもローカルLLMは応答できた A case study showing that a local LLM could handle a large project with 1800 files, 5 app …

AI要約 1800ファイル・5アプリ連携・1万行超のコードベースに対して、ローカルLLMで動作検証を行った事例紹介。大規模かつ複雑なプロジェクトでもローカルLLMが実用的な回答を返せたことを報告している。

EN A case study showing that a local LLM could handle a large project with 1800 files, 5 app integrations, and over 10,000 lines of code, providing useful answers despite the scale and complexity.

qiita.com
1800ファイル・5アプリ連携・1万行超。それでもローカルLLMはちゃんと答えてくれた og
NEW blog local-llm 2h ago · qiita-llm

効果的なAIエージェントの作り方 — Anthropic Barry Zhangが語る3つの原則 Anthropic's Barry Zhang outlines three principles for building effective AI agents: start …

AI要約 AnthropicのBarry Zhangが効果的なAIエージェント構築の3原則を解説。シンプルな設計から始めること、エージェントの視点で考えること、ツールやフィードバックループの質に投資することの重要性を強調している。

EN Anthropic's Barry Zhang outlines three principles for building effective AI agents: start simple, think from the agent's perspective, and invest in high-quality tools and feedback loops to ensure reliable performance.

qiita.com
効果的なAIエージェントの作り方 — Anthropic Barry Zhangが語る3つの原則 og
NEW blog tech-news 2h ago · the-verge

Logitech MX Creative ConsoleがMicrosoft Office対応に Microsoft Office can now be controlled with Logitech’s MX Creative Console

AI要約 LogitechがMX Creative Console向けに新たなプラグインを追加し、Microsoft Office、Slack、Notionなどの操作が可能になった。生産性向上を狙い、クリエイター向けデバイスをビジネス用途にも拡張する取り組み。

EN Logitech has expanded its MX Creative Console with new plugins, allowing users to control Microsoft Office, Slack, and Notion directly from the device, broadening its appeal beyond creative work into productivity tasks.

theverge.com
Microsoft Office can now be controlled with Logitech’s MX Creative Console og
NEW blog cursor 2h ago · qiita-cursor

VSCode/CursorでCodexプラグインを右サイドバーへ移動する方法 This article explains how to move the Codex plugin panel from the default left side to the…

AI要約 VSCodeおよびCursorにおいて、デフォルトで左側に配置されているCodexプラグインのパネルを右サイドバーへ移動する手順を解説した記事。コマンドパレットからの操作で、エディタの作業領域を確保しやすくなる。

EN This article explains how to move the Codex plugin panel from the default left side to the right sidebar in VSCode and Cursor, using the command palette to make better use of the editor workspace.

qiita.com
【VSCode/Cursor】Codexプラグインを右サイドバーへ移動する方法 og
NEW blog local-llm 2h ago · qiita-llm

毎セッション死んで蘇るAIエージェントが設計した記憶システム——embedding検索の落とし穴と解決策 This article describes a memory system designed for AI agents that lose context every sess…

AI要約 セッションごとに記憶を失うAIエージェントのために設計された記憶システムの実例を紹介。embeddingによる類似検索の落とし穴を指摘し、文脈や時系列を保持するための工夫と解決策を解説している。

EN This article describes a memory system designed for AI agents that lose context every session, highlighting pitfalls of embedding-based similarity search and proposing solutions to preserve context and temporal information.

qiita.com
毎セッション死んで蘇るAIエージェントが設計した記憶システム——embedding検索の落とし穴と解決策 og
NEW blog research 3h ago · simonw-blog

pip 26.1の新機能:ロックファイルと依存関係クールダウン What's new in pip 26.1 - lockfiles and dependency cooldowns!

AI要約 pip 26.1がリリースされ、PEP 751準拠のロックファイル生成と、新しすぎるパッケージのインストールを避ける依存関係クールダウン機能が追加された。サプライチェーン攻撃への対策として有用な機能となる。

EN pip 26.1 has been released, introducing PEP 751-compliant lockfile generation and a new dependency cooldown feature that avoids installing packages released too recently, helping mitigate supply chain attacks.

simonwillison.net
NEW blog tech-news 3h ago · techcrunch

富裕層向け高級ドッグフードブランド「Drizzle」が登場 Drizzle on top: a new high-end dog food brand is coming for the 1%

AI要約 新興ブランドDrizzleが、1%の富裕層をターゲットにした高級ドッグフードを発表した。プレミアム素材を使った高価格帯の商品で、ペットフード市場の上位層を狙う戦略だ。

EN A new high-end dog food brand called Drizzle is launching, targeting wealthy pet owners in the top 1% with premium ingredients and a luxury positioning in the pet food market.

techcrunch.com
Drizzle on top: a new high-end dog food brand is coming for the 1% og
NEW blog local-llm 4h ago · qiita-llm

DGX SparkでMistral Small 4 119B (UD-Q4_K_M)を動かす A practical report on running the Mistral Small 4 119B model in UD-Q4_K_M quantized format…

AI要約 NVIDIA DGX Spark上で大規模言語モデルMistral Small 4 119BをUD-Q4_K_M量子化形式で動作させる手順と検証結果を紹介。ローカル環境での大規模モデル運用の実例として参考になる内容。

EN A practical report on running the Mistral Small 4 119B model in UD-Q4_K_M quantized format on NVIDIA DGX Spark, sharing setup steps and performance observations for local large-model deployment.

qiita.com
DGX Spark で Mistral Small 4 119B (UD-Q4_K_M) を動かす og
NEW blog mcp 4h ago · qiita-mcp

ChatGPTのRemote MCPをGoogle認証付きで動かしてみた A hands-on report on building a Remote MCP server for ChatGPT's Developer Mode with Google…

AI要約 ChatGPTのDeveloper Mode向けRemote MCPサーバーをGoogle OAuth認証付きで構築した実装例を紹介。認可フローの設定方法やChatGPTから接続する手順を解説し、実際の動作を検証している。

EN A hands-on report on building a Remote MCP server for ChatGPT's Developer Mode with Google OAuth authentication, walking through the authorization flow setup and connection steps from ChatGPT.

qiita.com
ChatGPT の Remote MCP をGoogle認証付きで動かしてみた og
NEW blog copilot 4h ago · zenn-copilot

Copilot Pro が月300回制限からトークン課金へ—GPT-5.4×Copilot CLI の実コスト試算 GitHub Copilot Pro is shifting from a 300 monthly premium-request cap to token-based meter…

AI要約 GitHub Copilot Pro の課金体系が月300回のプレミアムリクエスト制から従量トークン課金へ移行。記事ではGPT-5.4とCopilot CLIを使った実利用での実コストを試算し、新旧プランの損益分岐点を検証している。

EN GitHub Copilot Pro is shifting from a 300 monthly premium-request cap to token-based metered billing. The article estimates real-world costs of using GPT-5.4 with Copilot CLI and analyzes the break-even point between the old and new pricing.

zenn.dev
NEW blog copilot 4h ago · zenn-copilot

社内生成AIをCline自律型コーディングエージェント化する方法(Remote-SSH編) A guide on turning an in-house OpenAI-compatible generative AI into an autonomous AI codin…

AI要約 社内のOpenAI互換API対応生成AIを、VSCode拡張ClineとRemote-SSHを組み合わせて自律型AIコーディングエージェントとして利用する手順を解説。リモート環境での設定方法やAPI接続の具体的なノウハウを紹介している。

EN A guide on turning an in-house OpenAI-compatible generative AI into an autonomous AI coding agent using the Cline VSCode extension over Remote-SSH, covering setup steps and API integration tips.

zenn.dev
NEW blog claude 4h ago · qiita-claude

AI会話・壁打ち管理ツール「KabeHub」の基本機能を紹介 This article introduces the basic features of KabeHub, a tool for managing conversations a…

AI要約 AIとの会話や壁打ちを管理するツール「KabeHub」の基本機能を紹介する記事。複数AIとの対話履歴を整理・活用できる仕組みを解説し、効率的な思考整理やアイデア出しを支援する用途を想定している。

EN This article introduces the basic features of KabeHub, a tool for managing conversations and brainstorming sessions with AI. It explains how users can organize and leverage AI dialogue histories to support efficient thinking and ideation.

qiita.com
AIとの会話・壁打ち管理ツール「KabeHub」でできることを紹介します(基本機能編) og
NEW paper research 5h ago · arxiv-cs-ai

数学には二者が必要:コミュニケーションにおける創発的数学的推論のテスト Math Takes Two: A test for emergent mathematical reasoning in communication

AI要約 本論文は、エージェント間のコミュニケーションを通じて数学的推論が創発するかを評価する新しいテストを提案する。単独での問題解決ではなく、二者の協調による数学的概念の伝達能力に焦点を当てている。

EN This paper proposes a new test for evaluating emergent mathematical reasoning in agent-to-agent communication, focusing on cooperative transmission of mathematical concepts between two parties rather than solo problem-solving.

arxiv.org
Math Takes Two: A test for emergent mathematical reasoning in communication og
NEW paper research 5h ago · arxiv-cs-ai

マルチモーダル基盤モデル高速化のためのハード・ソフト技術 Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models

AI要約 マルチモーダル基盤モデルの推論・学習を加速するハードウェアおよびソフトウェア技術に関するフォーカスセッション論文。複数モダリティを扱うモデル特有の計算課題に対応する最適化手法を議論する。

EN A focus session paper discussing hardware and software techniques to accelerate multimodal foundation models, addressing computational challenges unique to handling multiple modalities in inference and training.

arxiv.org
Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models og
NEW paper research 5h ago · arxiv-cs-ai

タスクネットワーク上でのマルチタスク最適化 Multi-Task Optimization over Networks of Tasks

AI要約 複数の関連タスクをネットワーク構造として捉え、その上で協調的に最適化を行うマルチタスク学習手法を提案する論文。タスク間の関係性を活用することで効率的な学習と性能向上を目指す。

EN This paper proposes a multi-task optimization framework where related tasks are organized as a network, leveraging inter-task relationships to enable collaborative optimization and improved learning efficiency.

arxiv.org
Multi-Task Optimization over Networks of Tasks og
NEW paper research 5h ago · arxiv-cs-ai

Mochi: メタ学習で事前学習と推論を整合する効率的グラフ基盤モデル Mochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning

AI要約 本論文は、グラフ基盤モデルにおける事前学習と推論のミスマッチを解消する手法Mochiを提案する。メタ学習を用いて両段階を整合させることで、効率的かつ高精度なグラフ表現学習を実現する。

EN This paper proposes Mochi, a meta-learning approach that aligns pre-training and inference stages for graph foundation models, enabling more efficient and accurate graph representation learning.

arxiv.org
Mochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning og
NEW paper research 5h ago · arxiv-cs-ai

精神科LLMタスクの信頼性監査:入院リスクスコア生成 Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores

AI要約 精神科領域でLLMが生成する入院リスクスコアの信頼性を監査する研究。下流タスクにおけるLLM出力の妥当性・一貫性を評価し、臨床応用におけるリスク評価の有用性と限界を検証する枠組みを提示する。

EN This paper proposes a reliability auditing framework for downstream LLM tasks in psychiatry, specifically evaluating LLM-generated hospitalization risk scores to assess validity, consistency, and clinical applicability.

arxiv.org
Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores og
NEW paper research 5h ago · arxiv-cs-ai

適応的で再現可能な医用画像処理のためのアーティファクト駆動エージェント基盤 An Artifact-based Agent Framework for Adaptive and Reproducible Medical Image Processing

AI要約 医用画像処理ワークフローを適応的かつ再現可能にするため、アーティファクトベースのエージェントフレームワークを提案する論文。エージェントが処理過程の成果物を介して連携し、柔軟なパイプライン構築と再現性確保を両立する仕組みを示す。

EN This paper proposes an artifact-based agent framework for medical image processing, where agents coordinate through shared artifacts to enable adaptive workflow construction while ensuring reproducibility of the processing pipelines.

arxiv.org
An Artifact-based Agent Framework for Adaptive and Reproducible Medical Image Processing og
NEW paper research 5h ago · arxiv-cs-ai

AgentSearchBench: 実環境でのAIエージェント検索ベンチマーク AgentSearchBench: A Benchmark for AI Agent Search in the Wild

AI要約 本論文は、実世界の検索タスクにおけるAIエージェントの性能を評価するための新しいベンチマーク「AgentSearchBench」を提案する。多様な検索シナリオを通じて、エージェントの情報収集能力や推論能力を測定する。

EN This paper introduces AgentSearchBench, a new benchmark designed to evaluate AI agents' performance on real-world search tasks, measuring their information gathering and reasoning capabilities across diverse scenarios.

arxiv.org
AgentSearchBench: A Benchmark for AI Agent Search in the Wild og
NEW paper research 5h ago · arxiv-cs-ai

スキルから才能へ:異種エージェントを実企業のように組織化する From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company

AI要約 異種のAIエージェントを現実の企業組織のように配置・連携させる手法を提案。スキルベースの割り当てから才能(タレント)としての役割分担へと拡張し、複雑タスクで高いパフォーマンスを示した。

EN This paper proposes organising heterogeneous AI agents like a real-world company, moving beyond skill-based assignments to talent-based role allocation, demonstrating improved performance on complex collaborative tasks.

arxiv.org
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company og
NEW paper research 5h ago · arxiv-cs-ai

ABPMSプロセスフレームのハイブリッド性と自動プロセス発見への影響 On the Hybrid Nature of ABPMS Process Frames and its Implications on Automated Process Discovery

AI要約 本論文はAgent-Based Process Management System (ABPMS) におけるプロセスフレームのハイブリッド性を考察し、自動プロセス発見への影響を分析する。構造化要素と非構造化要素の両立が発見手法の精度や適用性に課題をもたらすことを示す。

EN This paper examines the hybrid nature of process frames in Agent-Based Process Management Systems (ABPMS) and discusses how the coexistence of structured and unstructured elements affects the accuracy and applicability of automated process discovery techniques.

arxiv.org
On the Hybrid Nature of ABPMS Process Frames and its Implications on Automated Process Discovery og
NEW paper research 5h ago · arxiv-cs-ai

大規模言語モデルの隠れたランダム性を捉える「背景温度」の提案 Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models

AI要約 本論文は大規模言語モデルに内在するランダム性を定量化する新指標「背景温度」を導入する。温度0設定でも残る出力ばらつきを測定し、モデル固有の確率的性質を特徴づける枠組みを提案する。

EN This paper introduces 'background temperature' as a metric to characterise the hidden randomness inherent in large language models, quantifying output variability that persists even at temperature zero settings.

arxiv.org
Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models og
NEW paper research 5h ago · arxiv-cs-ai

スーパーマインド・テスト:プロービングエージェントによるエージェント社会の集合知評価 Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents

AI要約 エージェント社会の集合知を能動的に評価する新手法「Superminds Test」を提案。プロービングエージェントを社会に投入し、集団としての知性を測定する枠組みを構築した研究。

EN This paper proposes the Superminds Test, a framework to actively evaluate the collective intelligence of agent societies by injecting probing agents that measure the group's emergent intelligence.

arxiv.org
Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents og
NEW paper research 5h ago · arxiv-cs-ai

共有された語彙タスク表現がLLMの行動的ばらつきを説明する Shared Lexical Task Representations Explain Behavioral Variability In LLMs

AI要約 LLMの応答ばらつきを、モデル内部の共有された語彙タスク表現の観点から分析した研究。タスクごとに形成される潜在表現が、出力の多様性や一貫性のパターンを説明できることを示している。

EN This research investigates how shared lexical task representations within LLMs account for behavioral variability, demonstrating that latent task encodings explain patterns of output diversity and consistency across prompts.

arxiv.org
Shared Lexical Task Representations Explain Behavioral Variability In LLMs og
NEW paper research 5h ago · arxiv-cs-ai

軽量RAGとLLMによるスケーラブルな患者・治験マッチング Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching

AI要約 本研究は、軽量な検索拡張生成(RAG)と大規模言語モデルを組み合わせ、患者と臨床試験を効率的にマッチングする手法を提案。計算資源を抑えつつ高精度なマッチングを実現し、臨床試験の被験者選定の自動化と拡張性向上に貢献する。

EN This paper proposes a scalable patient-trial matching framework combining lightweight retrieval-augmented generation (RAG) with large language models, enabling efficient and accurate matching of patients to clinical trials while reducing computational overhead.

arxiv.org
Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching og
NEW paper research 5h ago · arxiv-cs-ai

会話型精神科問診における大規模質問バンクからの最適質問選択 Optimal Question Selection from a Large Question Bank for Clinical Field Recovery in Conversational Psychiatric Intake

AI要約 会話型精神科問診において、大規模質問バンクから臨床フィールド回復のための最適な質問を選択する手法を提案。患者から効率的に必要情報を引き出すため、質問の有用性を評価し選定するアプローチを示す。

EN This paper proposes a method for selecting optimal questions from a large question bank to recover clinical fields in conversational psychiatric intake, aiming to efficiently elicit necessary patient information.

arxiv.org
Optimal Question Selection from a Large Question Bank for Clinical Field Recovery in Conversational Psychiatric Intake og
NEW paper research 5h ago · arxiv-cs-lg

Universal Transformersにはメモリが必要:適応的再帰推論における深さと状態のトレードオフ Universal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning

AI要約 本論文はUniversal Transformersの適応的再帰推論能力を理論・実験の両面から分析し、深さを増やすだけでは不十分で、状態(メモリ)の保持が不可欠であることを示す。深さと状態次元の間に明確なトレードオフが存在することを明らかにした。

EN This paper analyzes Universal Transformers in adaptive recursive reasoning, showing that increasing depth alone is insufficient and persistent memory state is essential. The authors demonstrate a clear depth-state trade-off both theoretically and empirically.

arxiv.org
Universal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning og
NEW paper research 5h ago · arxiv-cs-lg

Transformer学習のスペクトル進化:過渡的圧縮波とQ/K-V非対称性 The Spectral Lifecycle of Transformer Training: Transient Compression Waves, Persistent Spectral Gradients, and the Q/K--V Asymmetry

AI要約 本論文はTransformer学習中の重み行列のスペクトル動態を分析し、過渡的な圧縮波と持続的なスペクトル勾配の存在を示す。さらにQ/KとVの間に明確な非対称性があることを明らかにし、注意機構の役割分担を解釈する手がかりを提供する。

EN This paper analyzes the spectral dynamics of weight matrices during Transformer training, identifying transient compression waves and persistent spectral gradients, and reveals a clear Q/K vs. V asymmetry that sheds light on functional roles within attention.

arxiv.org
The Spectral Lifecycle of Transformer Training: Transient Compression Waves, Persistent Spectral Gradients, and the Q/K--V Asymmetry og