HomeTags#arxivPage 2

#arxiv page 2/2 · 60 total

TODAY 30 entries
NEW paper research 5h ago · arxiv-cs-ai

DeepER-Medは、医学分野でエビデンスに基づく研究を推進するためのエージェントAIフレームワーク DeepER-Med: Advancing Deep Evidence-Based Research in Medicine Through Agentic AI

AI要約 DeepER-Medは、医学分野でエビデンスに基づく研究を推進するためのエージェントAIフレームワーク。複数の専門エージェントが連携し、文献検索・評価・統合を自動化することで、臨床的な意思決定支援と体系的レビューの効率化を目指す。

EN DeepER-Med is an agentic AI framework designed to advance evidence-based medical research by coordinating specialized agents that automate literature retrieval, appraisal, and synthesis to support clinical decision-making and systematic reviews.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

GISTは、インテリジェントな意味的トポロジーを用いて画像とテキストからマルチモーダルな知識抽出と空間的接地(グラウンディング)を同時に行う… GIST: Multimodal Knowledge Extraction and Spatial Grounding via Intelligent Semantic Topology

AI要約 GISTは、インテリジェントな意味的トポロジーを用いて画像とテキストからマルチモーダルな知識抽出と空間的接地(グラウンディング)を同時に行う新しいフレームワークを提案する論文である。意味構造を活用することで精度向上を達成する。

EN GIST is a new framework for simultaneous multimodal knowledge extraction and spatial grounding from images and text, leveraging intelligent semantic topology to improve accuracy.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文はカナダ政府のAI登録簿を分析し、公開されている情報が何を明らかにし、何を省略し、何を曖昧にしているかを検証する Bureaucratic Silences: What the Canadian AI Register Reveals, Omits, and Obscures

AI要約 本論文はカナダ政府のAI登録簿を分析し、公開されている情報が何を明らかにし、何を省略し、何を曖昧にしているかを検証する。官僚的な透明性制度の限界と、説明責任のギャップを指摘している。

EN This paper analyzes the Canadian AI Register, examining what it reveals, omits, and obscures about government AI use, and highlights the limitations of bureaucratic transparency mechanisms and gaps in accountability.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

LACE(Lattice Attention for Cross-thread Exploration)は、複数の推論スレッド間で情報を共有… LACE: Lattice Attention for Cross-thread Exploration

AI要約 LACE(Lattice Attention for Cross-thread Exploration)は、複数の推論スレッド間で情報を共有するための格子状アテンション機構を提案する研究。スレッド横断的な探索を可能にし、並列推論の効率と精度を向上させる。

EN LACE (Lattice Attention for Cross-thread Exploration) introduces a lattice-structured attention mechanism enabling information sharing across parallel reasoning threads, improving efficiency and accuracy of multi-thread inference.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、事前登録型の信念修正契約という枠組みを提案し、エージェントが新情報を受け取る前に信念更新の方針を明示的にコミットする手法を定式化す… Preregistered Belief Revision Contracts

AI要約 本論文は、事前登録型の信念修正契約という枠組みを提案し、エージェントが新情報を受け取る前に信念更新の方針を明示的にコミットする手法を定式化する。これにより信念変化の透明性と検証可能性を高めることを狙う。

EN The paper introduces preregistered belief revision contracts, a framework where agents commit in advance to how they will update beliefs upon receiving new information, aiming to make belief change more transparent and verifiable.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文はAIエージェントの蒸留過程において、安全でない行動が潜在的に教師モデルから生徒モデルへ転移する「サブリミナル転移」現象を検証した研究… Subliminal Transfer of Unsafe Behaviors in AI Agent Distillation

AI要約 本論文はAIエージェントの蒸留過程において、安全でない行動が潜在的に教師モデルから生徒モデルへ転移する「サブリミナル転移」現象を検証した研究である。明示的に有害データを除外しても、微細な統計的痕跡を通じて不安全行動が引き継がれる可能性を示す。

EN This paper investigates subliminal transfer of unsafe behaviors during AI agent distillation, showing that student models can inherit undesirable traits from teachers even when explicit harmful data is filtered out, via subtle statistical signals.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、モンテカルロ木探索(MCTS)を用いてエージェントのスキルを二階層最適化する手法を提案する Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

AI要約 本論文は、モンテカルロ木探索(MCTS)を用いてエージェントのスキルを二階層最適化する手法を提案する。上位層でスキル構造を探索し、下位層でパラメータを調整することで、複雑タスクにおけるエージェント性能を向上させる。

EN This paper proposes a bilevel optimization framework for agent skills using Monte Carlo Tree Search, where the upper level explores skill structures and the lower level tunes parameters to improve agent performance on complex tasks.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、世界が未来の情報を漏洩させるという観点から、進化的アプローチを活用した未来予測エージェントを提案する The World Leaks the Future: Harness Evolution for Future Prediction Agents

AI要約 本論文は、世界が未来の情報を漏洩させるという観点から、進化的アプローチを活用した未来予測エージェントを提案する。エージェントは環境からの手がかりを収集・進化させ、予測精度を向上させる手法を示している。

EN This paper proposes future prediction agents that harness evolutionary methods, based on the idea that the world leaks future information. The agents gather and evolve environmental cues to improve prediction accuracy.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、LLMの推論能力は出力される思考連鎖(Chain of Thought)そのものではなく、潜在表現の中に存在すると主張する LLM Reasoning Is Latent, Not the Chain of Thought

AI要約 本論文は、LLMの推論能力は出力される思考連鎖(Chain of Thought)そのものではなく、潜在表現の中に存在すると主張する。CoTテキストは内部の潜在的推論過程の表層的な痕跡に過ぎず、モデルの真の推論機構を理解するには潜在空間の分析が必要であると論じている。

EN This paper argues that LLM reasoning resides in latent representations rather than the explicit Chain of Thought output. The CoT text is merely a surface trace of deeper latent reasoning, suggesting that understanding true model reasoning requires analyzing latent spaces.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、代数的不変量を活用してLLMにアブダクション・演繹・帰納の構造化推論を行わせる手法を提案する Structured Abductive-Deductive-Inductive Reasoning for LLMs via Algebraic Invariants

AI要約 本論文は、代数的不変量を活用してLLMにアブダクション・演繹・帰納の構造化推論を行わせる手法を提案する。仮説生成を不変量探索に帰着させ、演繹的検証と帰納的一般化を組み合わせることで、推論の一貫性と検証可能性を高めることを目指す。

EN This paper proposes a structured abductive-deductive-inductive reasoning framework for LLMs based on algebraic invariants, casting hypothesis generation as invariant discovery combined with deductive verification and inductive generalization to improve reasoning consistency and verifiability.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

KWBenchは、知識労働においてLLMが明示的な指示なしに問題を自発的に認識できるかを測定する新しいベンチマーク KWBench: Measuring Unprompted Problem Recognition in Knowledge Work

AI要約 KWBenchは、知識労働においてLLMが明示的な指示なしに問題を自発的に認識できるかを測定する新しいベンチマーク。実世界のタスクに潜む課題をモデルが気付けるかを評価し、従来の指示追従型評価を補完する。

EN KWBench is a new benchmark measuring whether LLMs can spontaneously recognize problems in knowledge work tasks without explicit prompting, complementing traditional instruction-following evaluations.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文はブラックボックス組合せ最適化のためのStein変分推論に基づく新手法を提案する Stein Variational Black-Box Combinatorial Optimization

AI要約 本論文はブラックボックス組合せ最適化のためのStein変分推論に基づく新手法を提案する。勾配情報が得られない離散探索空間において、粒子群を用いた分布近似で効率的に最適解を探索し、従来手法を上回る性能を示す。

EN This paper proposes a Stein variational inference approach for black-box combinatorial optimization, using particle-based distribution approximation to efficiently search discrete spaces without gradient information, outperforming prior methods.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

Lean 4におけるハードモードの自動定理証明のためのオープンソースのエージェント型フレームワーク「Discover and Prove」を… Discover and Prove: An Open-source Agentic Framework for Hard Mode Automated Theorem Proving in Lean 4

AI要約 Lean 4におけるハードモードの自動定理証明のためのオープンソースのエージェント型フレームワーク「Discover and Prove」を提案。発見と証明を組み合わせた手法で、難易度の高い定理証明タスクに取り組む。

EN Proposes Discover and Prove, an open-source agentic framework for hard mode automated theorem proving in Lean 4, combining discovery and proving stages to tackle challenging theorem proving tasks.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

LLMエージェントの経験蓄積手法を「記憶・スキル・ルール」という圧縮度の異なるスペクトルとして統一的に捉える枠組みを提案する論文 Experience Compression Spectrum: Unifying Memory, Skills, and Rules in LLM Agents

AI要約 LLMエージェントの経験蓄積手法を「記憶・スキル・ルール」という圧縮度の異なるスペクトルとして統一的に捉える枠組みを提案する論文。各形式の抽象化レベルと適用場面を整理し、エージェント設計における経験活用の指針を示す。

EN This paper proposes a unified framework viewing experience accumulation in LLM agents as a compression spectrum spanning memory, skills, and rules, clarifying abstraction levels and use cases to guide agent design.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

本論文は、特徴量帰属による説明可能性に厳密な数学的基盤を与える試みを提案する Towards Rigorous Explainability by Feature Attribution

AI要約 本論文は、特徴量帰属による説明可能性に厳密な数学的基盤を与える試みを提案する。従来のヒューリスティックな手法を超え、説明の正確性や一貫性を保証する形式的枠組みを構築し、信頼性のあるAI解釈を目指す。

EN This paper proposes a rigorous mathematical framework for explainability via feature attribution, moving beyond heuristic methods to provide formal guarantees on explanation correctness and consistency for trustworthy AI interpretation.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-lg

Functional Similarity Metric for Neural Networks: Overcoming Parametric Ambiguity via Activation Region Analysis Functional Similarity Metric for Neural Networks: Overcoming Parametric Ambiguity via Activation Region Analysis

EN arXiv:2604.16426v1 Announce Type: new Abstract: As modern deep learning architectures grow in complexity, representational ambiguity emerges as a critical barrier to their interpretability and reliabl

arxiv.org
fallback