LIVE · 04/27
claudeClaude Code auto modeでpermission設定の悩みを解消Claude Code's new auto mode eliminates the hassle of manual permission configuration[qiita-claude]claude最近のClaude Codeの品質低下を感じていましたか?The author noticed a recent decline in Claude Code's response quality and instruction-foll…[qiita-claude]claudeClaude CodeにSubagent @mention追加 — 並列タスク委任で開発加速Claude Code introduced a new @mention feature for subagents, allowing developers to delega…[qiita-claude]tech-newsAmazonの新ポッドキャスト戦略:あらゆるコンテンツを収益化Amazon’s new podcast strategy: Monetize everything[techcrunch]research数学には二者が必要:コミュニケーションにおける創発的数学的推論のテストMath Takes Two: A test for emergent mathematical reasoning in communication[arxiv-cs-lg]researchマルチモーダル基盤モデル高速化のためのハード・ソフト技術Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models[arxiv-cs-lg]researchタスクネットワーク上でのマルチタスク最適化Multi-Task Optimization over Networks of Tasks[arxiv-cs-lg]researchMochi: メタ学習で事前学習と推論を整合する効率的グラフ基盤モデルMochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning[arxiv-cs-lg]research精神科LLMタスクの信頼性監査:入院リスクスコア生成Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores[arxiv-cs-lg]research大規模言語モデルの隠れたランダム性を捉える「背景温度」の提案Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models[arxiv-cs-lg]researchスーパーマインド・テスト:プロービングエージェントによるエージェント社会の集合知評価Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents[arxiv-cs-lg]researchUniversal Transformersにはメモリが必要:適応的再帰推論における深さと状態のトレードオフUniversal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning[arxiv-cs-lg]research共有された語彙タスク表現がLLMの行動的ばらつきを説明するShared Lexical Task Representations Explain Behavioral Variability In LLMs[arxiv-cs-lg]research軽量RAGとLLMによるスケーラブルな患者・治験マッチングLightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching[arxiv-cs-lg]research陸上競技のパフォーマンス異常検知:視覚分析を用いたベンチマーキングシステムPerformance Anomaly Detection in Athletics: A Benchmarking System with Visual Analytics[arxiv-cs-lg]researchソフト調和関数を用いた条件付き異常検知:臨床アラートへの応用Conditional anomaly detection using soft harmonic functions: An application to clinical alerting[arxiv-cs-lg]researchクォートの崩壊:指値注文板における一時的な機械的流動性侵食の検出When Quotes Crumble: Detecting Transient Mechanical Liquidity Erosion in Limit Order Books[arxiv-cs-lg]researchカーネル契約: 異種シリコン横断のMLカーネル正当性のための仕様記述言語Kernel Contracts: A Specification Language for ML Kernel Correctness Across Heterogeneous Silicon[arxiv-cs-lg]researchLTBs-KAN: 線形時間Bスプラインを用いたKolmogorov-ArnoldネットワークLTBs-KAN: Linear-Time B-splines Kolmogorov-Arnold Networks[arxiv-cs-lg]research会話型精神科問診における大規模質問バンクからの最適質問選択Optimal Question Selection from a Large Question Bank for Clinical Field Recovery in Conversational Psychiatric Intake[arxiv-cs-cl]researchYouTubeの牛尿で便秘治療?LLMによる文化固有の健康誤情報検出の限界When Cow Urine Cures Constipation on YouTube: Limits of LLMs in Detecting Culture-specific Health Misinformation[arxiv-cs-cl]research視覚言語モデルにおけるソースモダリティのモニタリングSource-Modality Monitoring in Vision-Language Models[arxiv-cs-cl]research強化学習によるVLMのニューロシンボリック言語推論の促進Incentivizing Neuro-symbolic Language-based Reasoning in VLMs via Reinforcement Learning[arxiv-cs-cl]research結果報酬は検証可能・因果的に重要な推論を保証しないOutcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning[arxiv-cs-cl]
Today 102
Total 500
Major 12
Sources 47
Updated just now
Daily Summary

今日の更新

Today's Updates

Today 102 ▲ 85%
Yesterday 55
7-day 333
Last 7 days
9
13
45
42
67
55
102
04/21 04/22 04/23 04/24 04/25 04/26 04/27
主要な更新 Top stories 04/27 · 10 件
  1. 01 claude Claude Code auto modeでpermission設定の悩みを解消 Claude Code's new auto mode eliminates the hassle of manual permission configuration Claude Codeに新登場したauto modeにより、これまで煩雑だったpermission設定が不要になる。コマンドごとの許可確認に悩まされず、自動的に適切な権限管理が行われるため、開発体験が大きく向上する。 Claude Code's new auto mode eliminates the hassle of manual permission configuration. It automatically handles command authorization, freeing developers from repetitive approval prompts and improving the overall development experience. [qiita-claude]
  2. 02 claude 最近のClaude Codeの品質低下を感じていましたか? The author noticed a recent decline in Claude Code's response quality and instruction-foll… 筆者は最近Claude Codeの応答品質や指示追従性が低下していると感じている。Anthropic公式も一部モデルで品質劣化のバグを認めて修正対応中であり、ユーザーの体感は実際の不具合に起因していた可能性があると報告している。 The author noticed a recent decline in Claude Code's response quality and instruction-following. Anthropic has officially acknowledged bugs causing degraded output on some models and is rolling out fixes, suggesting users' frustrations were rooted in real issues. [qiita-claude]
  3. 03 claude Claude CodeにSubagent @mention追加 — 並列タスク委任で開発加速 Claude Code introduced a new @mention feature for subagents, allowing developers to delega… Claude Codeに@mentionでSubagentを呼び出せる新機能が追加された。複数のサブエージェントへ並列にタスクを委任できるようになり、コード生成やレビューなどの作業を分担して同時実行することで開発速度の向上が期待される。 Claude Code introduced a new @mention feature for subagents, allowing developers to delegate tasks to multiple subagents in parallel. This enables concurrent execution of work like code generation and review, potentially boosting development speed. [qiita-claude]
  4. 04 tech-news Amazonの新ポッドキャスト戦略:あらゆるコンテンツを収益化 Amazon’s new podcast strategy: Monetize everything Amazonはポッドキャスト事業の新戦略として、あらゆる形式のコンテンツの収益化を進める方針を示した。Wondery傘下の番組やAudible、Amazon Musicを通じた配信を活用し、広告やサブスクリプションを組み合わせた多角的な収益モデルを構築する。 Amazon is rolling out a new podcast strategy focused on monetizing every type of content across its platforms, leveraging Wondery, Audible, and Amazon Music with a mix of ads and subscriptions to maximize revenue. [techcrunch]
  5. 05 research 数学には二者が必要:コミュニケーションにおける創発的数学的推論のテスト Math Takes Two: A test for emergent mathematical reasoning in communication 本論文は、エージェント間のコミュニケーションを通じて数学的推論が創発するかを評価する新しいテストを提案する。単独での問題解決ではなく、二者の協調による数学的概念の伝達能力に焦点を当てている。 This paper proposes a new test for evaluating emergent mathematical reasoning in agent-to-agent communication, focusing on cooperative transmission of mathematical concepts between two parties rather than solo problem-solving. [arxiv-cs-lg]
  6. 06 research マルチモーダル基盤モデル高速化のためのハード・ソフト技術 Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models マルチモーダル基盤モデルの推論・学習を加速するハードウェアおよびソフトウェア技術に関するフォーカスセッション論文。複数モダリティを扱うモデル特有の計算課題に対応する最適化手法を議論する。 A focus session paper discussing hardware and software techniques to accelerate multimodal foundation models, addressing computational challenges unique to handling multiple modalities in inference and training. [arxiv-cs-lg]
  7. 07 research タスクネットワーク上でのマルチタスク最適化 Multi-Task Optimization over Networks of Tasks 複数の関連タスクをネットワーク構造として捉え、その上で協調的に最適化を行うマルチタスク学習手法を提案する論文。タスク間の関係性を活用することで効率的な学習と性能向上を目指す。 This paper proposes a multi-task optimization framework where related tasks are organized as a network, leveraging inter-task relationships to enable collaborative optimization and improved learning efficiency. [arxiv-cs-lg]
  8. 08 research Mochi: メタ学習で事前学習と推論を整合する効率的グラフ基盤モデル Mochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning 本論文は、グラフ基盤モデルにおける事前学習と推論のミスマッチを解消する手法Mochiを提案する。メタ学習を用いて両段階を整合させることで、効率的かつ高精度なグラフ表現学習を実現する。 This paper proposes Mochi, a meta-learning approach that aligns pre-training and inference stages for graph foundation models, enabling more efficient and accurate graph representation learning. [arxiv-cs-lg]
  9. 09 research 精神科LLMタスクの信頼性監査:入院リスクスコア生成 Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores 精神科領域でLLMが生成する入院リスクスコアの信頼性を監査する研究。下流タスクにおけるLLM出力の妥当性・一貫性を評価し、臨床応用におけるリスク評価の有用性と限界を検証する枠組みを提示する。 This paper proposes a reliability auditing framework for downstream LLM tasks in psychiatry, specifically evaluating LLM-generated hospitalization risk scores to assess validity, consistency, and clinical applicability. [arxiv-cs-lg]
  10. 10 research 大規模言語モデルの隠れたランダム性を捉える「背景温度」の提案 Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models 本論文は大規模言語モデルに内在するランダム性を定量化する新指標「背景温度」を導入する。温度0設定でも残る出力ばらつきを測定し、モデル固有の確率的性質を特徴づける枠組みを提案する。 This paper introduces 'background temperature' as a metric to characterise the hidden randomness inherent in large language models, quantifying output variability that persists even at temperature zero settings. [arxiv-cs-lg]
🔥 Today's Top 3 importance × recency
  1. CohereとAleph Alphaが合併、その狙いとは Why Cohere is merging with Aleph Alpha techcrunch 1d ago
  2. GoogleがAnthropicに最大400億ドル投資へ Google will invest as much as $40 billion in Anthropic ars-technica 2d ago
  3. GPT-5.5、GitHub CopilotやM365 Copilotなどに本日展開開始 Super excited GPT-5.5 is rolling out to GitHub Copilot, M365 Copilot, Copilot Studio and Foundry today. With deeper reasoning, stronger multistep execution and better performance across long, complex tasks, GPT-5.5 helps you go from idea to execution faster with fewer iterations to get to the right outcome. …Looking forward to what you build! microsoft-source 2d ago

Timeline 500 total · page 1/17

TODAY 30 entries
NEW blog mcp 1h ago · qiita-mcp

フォームサービス選定チェックリスト: Google Forms/Microsoft Forms/Tally/Jotform/SurveyMonkey/FORMLOVA比較 This article compares major form-building services including Google Forms, Microsoft Forms…

AI要約 主要なフォーム作成サービスであるGoogle Forms、Microsoft Forms、Tally、Jotform、SurveyMonkey、FORMLOVAを比較し、選定時に確認すべきチェックポイントを整理した記事。用途や機能要件に応じた使い分けの指針を提示している。

EN This article compares major form-building services including Google Forms, Microsoft Forms, Tally, Jotform, SurveyMonkey, and FORMLOVA, providing a checklist of key points to consider when selecting the right tool for different use cases and requirements.

qiita.com
フォームサービス選定チェックリスト: Google Forms / Microsoft Forms / Tally / Jotform / SurveyMonkey / FORMLOVA og
NEW blog gemini 2h ago · google-deepmind

Google DeepMind、韓国政府とのAIパートナーシップを発表 Announcing our partnership with the Republic of Korea

AI要約 Google DeepMindは大韓民国政府との戦略的パートナーシップを発表した。AI研究、人材育成、社会的応用の分野で協力し、韓国のAIエコシステムの発展と責任あるAI活用を推進する。

EN Google DeepMind announced a strategic partnership with the Republic of Korea, focusing on collaboration in AI research, talent development, and societal applications to advance Korea's AI ecosystem and responsible AI adoption.

deepmind.google
Announcing our partnership with the Republic of Korea media
NEW blog claude 2h ago · qiita-claude

Claude Code auto modeでpermission設定の悩みを解消 Claude Code's new auto mode eliminates the hassle of manual permission configuration

AI要約 Claude Codeに新登場したauto modeにより、これまで煩雑だったpermission設定が不要になる。コマンドごとの許可確認に悩まされず、自動的に適切な権限管理が行われるため、開発体験が大きく向上する。

EN Claude Code's new auto mode eliminates the hassle of manual permission configuration. It automatically handles command authorization, freeing developers from repetitive approval prompts and improving the overall development experience.

qiita.com
【claude code auto mode登場^-^】permission設定もう悩まない og
NEW blog cursor 3h ago · qiita-cursor

SaveSmart - AI Reading ListをChrome Web Storeでリリース The author released SaveSmart - AI Reading List on the Chrome Web Store, a browser extensi…

AI要約 記事や動画を保存しAIで要約・整理できるChrome拡張機能「SaveSmart - AI Reading List」をChrome Web Storeで公開した。読みたいコンテンツを効率的に管理できるリーディングリストツールである。

EN The author released SaveSmart - AI Reading List on the Chrome Web Store, a browser extension that lets users save articles and videos and organize them with AI-powered summarization for efficient reading management.

qiita.com
SaveSmart - AI Reading List をChrome Web Storeでリリースしました og
NEW blog local-llm 3h ago · qiita-llm

Microsoft markitdownの実力検証 — PDF・Excel・画像をfudebakoで試す This article tests Microsoft's markitdown document conversion tool against various file fo…

AI要約 Microsoftのドキュメント変換ツールmarkitdownを、PDF・Excel・画像といった多様なファイル形式に対してfudebako環境で実際に動作検証した記事。各形式での変換精度や使い勝手を比較し、実用性を評価している。

EN This article tests Microsoft's markitdown document conversion tool against various file formats including PDF, Excel, and images using the fudebako environment, evaluating its conversion accuracy and practical usability across formats.

qiita.com
Microsoft markitdown はどこまで使えるか — PDF / エクセル / 画像を fudebako で検証 og
NEW blog claude 3h ago · qiita-claude

最近のClaude Codeの品質低下を感じていましたか? The author noticed a recent decline in Claude Code's response quality and instruction-foll…

AI要約 筆者は最近Claude Codeの応答品質や指示追従性が低下していると感じている。Anthropic公式も一部モデルで品質劣化のバグを認めて修正対応中であり、ユーザーの体感は実際の不具合に起因していた可能性があると報告している。

EN The author noticed a recent decline in Claude Code's response quality and instruction-following. Anthropic has officially acknowledged bugs causing degraded output on some models and is rolling out fixes, suggesting users' frustrations were rooted in real issues.

qiita.com
あなたもここ最近のclaude codeの品質低下を感じていましたか? og
NEW blog claude 3h ago · qiita-claude

Claude CodeにSubagent @mention追加 — 並列タスク委任で開発加速 Claude Code introduced a new @mention feature for subagents, allowing developers to delega…

AI要約 Claude Codeに@mentionでSubagentを呼び出せる新機能が追加された。複数のサブエージェントへ並列にタスクを委任できるようになり、コード生成やレビューなどの作業を分担して同時実行することで開発速度の向上が期待される。

EN Claude Code introduced a new @mention feature for subagents, allowing developers to delegate tasks to multiple subagents in parallel. This enables concurrent execution of work like code generation and review, potentially boosting development speed.

qiita.com
Claude CodeにSubagent @mentionが来た — 並列タスク委任で開発速度はどう変わるか og
NEW blog local-llm 3h ago · qiita-llm

Claude Codeのトークン制限を制御するcron戦略と実務活用 Introduces a cron-based strategy to control Claude Code session start timing in response t…

AI要約 Claude Codeのトークン使用量制限に対し、cronを用いてセッション開始タイミングを制御する戦略を紹介。利用枠を効率的に使い切り、開発作業を中断せず進めるための実務的な運用ノウハウを解説している。

EN Introduces a cron-based strategy to control Claude Code session start timing in response to token usage limits, sharing practical operational know-how to efficiently use quotas without interrupting development work.

qiita.com
Claude Codeのトークン制限を制御するcron戦略と実務活用 og
NEW blog claude 4h ago · qiita-claude

Claude無料 vs Gemini無料、個人開発で使えるのはどっち?徹底比較【2026年版】 A comparison of the free tiers of Claude and Gemini for individual developers in 2026, eva…

AI要約 個人開発者向けにClaudeとGeminiの無料プランを比較した記事。コード生成精度、利用制限、UIなどの観点で実際の使用感を検証し、用途に応じた使い分けを提案している。

EN A comparison of the free tiers of Claude and Gemini for individual developers in 2026, evaluating code generation quality, usage limits, and UX to suggest which suits various use cases.

qiita.com
Claude無料 vs Gemini無料、個人開発で実際に使えるのはどっち?徹底比較【2026年版】 og
NEW paper research 5h ago · arxiv-cs-lg

数学には二者が必要:コミュニケーションにおける創発的数学的推論のテスト Math Takes Two: A test for emergent mathematical reasoning in communication

AI要約 本論文は、エージェント間のコミュニケーションを通じて数学的推論が創発するかを評価する新しいテストを提案する。単独での問題解決ではなく、二者の協調による数学的概念の伝達能力に焦点を当てている。

EN This paper proposes a new test for evaluating emergent mathematical reasoning in agent-to-agent communication, focusing on cooperative transmission of mathematical concepts between two parties rather than solo problem-solving.

arxiv.org
Math Takes Two: A test for emergent mathematical reasoning in communication og
NEW paper research 5h ago · arxiv-cs-lg

マルチモーダル基盤モデル高速化のためのハード・ソフト技術 Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models

AI要約 マルチモーダル基盤モデルの推論・学習を加速するハードウェアおよびソフトウェア技術に関するフォーカスセッション論文。複数モダリティを扱うモデル特有の計算課題に対応する最適化手法を議論する。

EN A focus session paper discussing hardware and software techniques to accelerate multimodal foundation models, addressing computational challenges unique to handling multiple modalities in inference and training.

arxiv.org
Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models og
NEW paper research 5h ago · arxiv-cs-lg

タスクネットワーク上でのマルチタスク最適化 Multi-Task Optimization over Networks of Tasks

AI要約 複数の関連タスクをネットワーク構造として捉え、その上で協調的に最適化を行うマルチタスク学習手法を提案する論文。タスク間の関係性を活用することで効率的な学習と性能向上を目指す。

EN This paper proposes a multi-task optimization framework where related tasks are organized as a network, leveraging inter-task relationships to enable collaborative optimization and improved learning efficiency.

arxiv.org
Multi-Task Optimization over Networks of Tasks og
NEW paper research 5h ago · arxiv-cs-lg

Mochi: メタ学習で事前学習と推論を整合する効率的グラフ基盤モデル Mochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning

AI要約 本論文は、グラフ基盤モデルにおける事前学習と推論のミスマッチを解消する手法Mochiを提案する。メタ学習を用いて両段階を整合させることで、効率的かつ高精度なグラフ表現学習を実現する。

EN This paper proposes Mochi, a meta-learning approach that aligns pre-training and inference stages for graph foundation models, enabling more efficient and accurate graph representation learning.

arxiv.org
Mochi: Aligning Pre-training and Inference for Efficient Graph Foundation Models via Meta-Learning og
NEW paper research 5h ago · arxiv-cs-lg

精神科LLMタスクの信頼性監査:入院リスクスコア生成 Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores

AI要約 精神科領域でLLMが生成する入院リスクスコアの信頼性を監査する研究。下流タスクにおけるLLM出力の妥当性・一貫性を評価し、臨床応用におけるリスク評価の有用性と限界を検証する枠組みを提示する。

EN This paper proposes a reliability auditing framework for downstream LLM tasks in psychiatry, specifically evaluating LLM-generated hospitalization risk scores to assess validity, consistency, and clinical applicability.

arxiv.org
Reliability Auditing for Downstream LLM tasks in Psychiatry: LLM-Generated Hospitalization Risk Scores og
NEW paper research 5h ago · arxiv-cs-lg

大規模言語モデルの隠れたランダム性を捉える「背景温度」の提案 Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models

AI要約 本論文は大規模言語モデルに内在するランダム性を定量化する新指標「背景温度」を導入する。温度0設定でも残る出力ばらつきを測定し、モデル固有の確率的性質を特徴づける枠組みを提案する。

EN This paper introduces 'background temperature' as a metric to characterise the hidden randomness inherent in large language models, quantifying output variability that persists even at temperature zero settings.

arxiv.org
Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models og
NEW paper research 5h ago · arxiv-cs-lg

スーパーマインド・テスト:プロービングエージェントによるエージェント社会の集合知評価 Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents

AI要約 エージェント社会の集合知を能動的に評価する新手法「Superminds Test」を提案。プロービングエージェントを社会に投入し、集団としての知性を測定する枠組みを構築した研究。

EN This paper proposes the Superminds Test, a framework to actively evaluate the collective intelligence of agent societies by injecting probing agents that measure the group's emergent intelligence.

arxiv.org
Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents og
NEW paper research 5h ago · arxiv-cs-lg

Universal Transformersにはメモリが必要:適応的再帰推論における深さと状態のトレードオフ Universal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning

AI要約 本論文はUniversal Transformersの適応的再帰推論能力を理論・実験の両面から分析し、深さを増やすだけでは不十分で、状態(メモリ)の保持が不可欠であることを示す。深さと状態次元の間に明確なトレードオフが存在することを明らかにした。

EN This paper analyzes Universal Transformers in adaptive recursive reasoning, showing that increasing depth alone is insufficient and persistent memory state is essential. The authors demonstrate a clear depth-state trade-off both theoretically and empirically.

arxiv.org
Universal Transformers Need Memory: Depth-State Trade-offs in Adaptive Recursive Reasoning og
NEW paper research 5h ago · arxiv-cs-lg

共有された語彙タスク表現がLLMの行動的ばらつきを説明する Shared Lexical Task Representations Explain Behavioral Variability In LLMs

AI要約 LLMの応答ばらつきを、モデル内部の共有された語彙タスク表現の観点から分析した研究。タスクごとに形成される潜在表現が、出力の多様性や一貫性のパターンを説明できることを示している。

EN This research investigates how shared lexical task representations within LLMs account for behavioral variability, demonstrating that latent task encodings explain patterns of output diversity and consistency across prompts.

arxiv.org
Shared Lexical Task Representations Explain Behavioral Variability In LLMs og
NEW paper research 5h ago · arxiv-cs-lg

軽量RAGとLLMによるスケーラブルな患者・治験マッチング Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching

AI要約 本研究は、軽量な検索拡張生成(RAG)と大規模言語モデルを組み合わせ、患者と臨床試験を効率的にマッチングする手法を提案。計算資源を抑えつつ高精度なマッチングを実現し、臨床試験の被験者選定の自動化と拡張性向上に貢献する。

EN This paper proposes a scalable patient-trial matching framework combining lightweight retrieval-augmented generation (RAG) with large language models, enabling efficient and accurate matching of patients to clinical trials while reducing computational overhead.

arxiv.org
Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching og
NEW paper research 5h ago · arxiv-cs-lg

陸上競技のパフォーマンス異常検知:視覚分析を用いたベンチマーキングシステム Performance Anomaly Detection in Athletics: A Benchmarking System with Visual Analytics

AI要約 陸上競技における選手のパフォーマンス異常を検出するためのベンチマーキングシステムを提案。視覚分析手法を統合し、コーチや分析者が異常な成績変動を直感的に把握できるよう支援する枠組みを示している。

EN This paper proposes a benchmarking system for detecting performance anomalies in athletics, integrating visual analytics to help coaches and analysts intuitively identify abnormal variations in athletes' results.

arxiv.org
Performance Anomaly Detection in Athletics: A Benchmarking System with Visual Analytics og
NEW paper research 5h ago · arxiv-cs-lg

ソフト調和関数を用いた条件付き異常検知:臨床アラートへの応用 Conditional anomaly detection using soft harmonic functions: An application to clinical alerting

AI要約 本研究では、グラフベースのソフト調和関数を用いた条件付き異常検知手法を提案する。臨床現場での患者管理アラート生成に応用し、専門医の判断を逸脱する治療を検出することを目的としている。

EN This paper proposes a conditional anomaly detection method based on graph-based soft harmonic functions, applied to clinical alerting to detect patient management decisions that deviate from expert practice.

arxiv.org
Conditional anomaly detection using soft harmonic functions: An application to clinical alerting og
NEW paper research 5h ago · arxiv-cs-lg

クォートの崩壊:指値注文板における一時的な機械的流動性侵食の検出 When Quotes Crumble: Detecting Transient Mechanical Liquidity Erosion in Limit Order Books

AI要約 本論文は、指値注文板(LOB)における一時的な機械的流動性の劣化を検出する手法を提案する。クォート崩壊現象を定量化し、市場マイクロストラクチャの観点から流動性リスクを評価する枠組みを示す。

EN This paper proposes a method to detect transient mechanical liquidity erosion in limit order books, quantifying quote-crumbling phenomena and providing a framework to assess liquidity risk from a market microstructure perspective.

arxiv.org
When Quotes Crumble: Detecting Transient Mechanical Liquidity Erosion in Limit Order Books og
NEW paper research 5h ago · arxiv-cs-lg

カーネル契約: 異種シリコン横断のMLカーネル正当性のための仕様記述言語 Kernel Contracts: A Specification Language for ML Kernel Correctness Across Heterogeneous Silicon

AI要約 異種ハードウェア(GPU/TPU/NPU等)間でMLカーネルの正当性を保証するための仕様記述言語「Kernel Contracts」を提案。数値精度や形状、メモリ整合性などを宣言的に記述し、移植時のバグ検出や検証を容易にする枠組みを示す。

EN This paper proposes Kernel Contracts, a specification language for verifying ML kernel correctness across heterogeneous silicon (GPUs, TPUs, NPUs). It enables declarative descriptions of numerical precision, shapes, and memory invariants to detect portability bugs.

arxiv.org
NEW paper research 5h ago · arxiv-cs-lg

LTBs-KAN: 線形時間Bスプラインを用いたKolmogorov-Arnoldネットワーク LTBs-KAN: Linear-Time B-splines Kolmogorov-Arnold Networks

AI要約 Kolmogorov-Arnoldネットワーク(KAN)の計算コストを削減するため、Bスプラインを線形時間で評価する新手法LTBs-KANを提案。従来のKANと同等の精度を保ちつつ、計算効率を大幅に改善した。

EN This paper proposes LTBs-KAN, a linear-time B-spline evaluation method for Kolmogorov-Arnold Networks (KAN), which significantly reduces computational cost while maintaining accuracy comparable to standard KAN implementations.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

会話型精神科問診における大規模質問バンクからの最適質問選択 Optimal Question Selection from a Large Question Bank for Clinical Field Recovery in Conversational Psychiatric Intake

AI要約 会話型精神科問診において、大規模質問バンクから臨床フィールド回復のための最適な質問を選択する手法を提案。患者から効率的に必要情報を引き出すため、質問の有用性を評価し選定するアプローチを示す。

EN This paper proposes a method for selecting optimal questions from a large question bank to recover clinical fields in conversational psychiatric intake, aiming to efficiently elicit necessary patient information.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

YouTubeの牛尿で便秘治療?LLMによる文化固有の健康誤情報検出の限界 When Cow Urine Cures Constipation on YouTube: Limits of LLMs in Detecting Culture-specific Health Misinformation

AI要約 本研究はLLMが文化固有の健康誤情報を検出する能力を評価し、英語中心の一般的な誤情報には強いが、牛尿療法など非西洋文化圏特有の誤情報の判定では精度が大きく低下することを示した。多文化対応の評価基準の必要性を指摘している。

EN This paper evaluates LLMs' ability to detect culture-specific health misinformation, finding that while models handle mainstream English misinformation well, they perform significantly worse on non-Western cultural claims such as cow urine remedies, highlighting the need for culturally inclusive benchmarks.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

視覚言語モデルにおけるソースモダリティのモニタリング Source-Modality Monitoring in Vision-Language Models

AI要約 本研究は、視覚言語モデル(VLM)が情報の出所(画像かテキストか)をどの程度区別・追跡できるかを検証する。実験の結果、VLMはソースモダリティの識別に苦戦し、混同や誤帰属が生じることが明らかになった。

EN This paper investigates whether vision-language models can monitor and distinguish the source modality (image vs. text) of information they process, finding that VLMs struggle to reliably track source modality and frequently misattribute information across modalities.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

強化学習によるVLMのニューロシンボリック言語推論の促進 Incentivizing Neuro-symbolic Language-based Reasoning in VLMs via Reinforcement Learning

AI要約 本論文は、視覚言語モデル(VLM)においてニューロシンボリックな言語ベース推論を強化学習で促進する手法を提案。記号的表現と自然言語推論を組み合わせ、報酬設計により論理的整合性のある推論能力を学習させ、複雑な視覚推論タスクで性能向上を示す。

EN This paper proposes a reinforcement learning approach to incentivize neuro-symbolic language-based reasoning in vision-language models (VLMs), combining symbolic representations with natural language reasoning to improve logical consistency on complex visual reasoning tasks.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

結果報酬は検証可能・因果的に重要な推論を保証しない Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

AI要約 本論文は、結果ベースの報酬による強化学習が、検証可能で因果的に重要な推論過程を生み出すとは限らないことを示す。最終解の正答率が向上しても、中間の推論ステップは結論に対して因果的役割を果たしていない場合が多いと指摘する。

EN This paper shows that outcome-based reward training in RL does not guarantee that models produce verifiable or causally important reasoning steps; final-answer accuracy can improve while intermediate chain-of-thought steps remain causally irrelevant to the conclusion.

arxiv.org
NEW paper research 5h ago · arxiv-cs-cl

ローカル運用向けウクライナ語RAG:ハイブリッド検索と軽量生成の最適化 An End-to-End Ukrainian RAG for Local Deployment. Optimized Hybrid Search and Lightweight Generation

AI要約 ローカル展開可能なウクライナ語向けエンドツーエンドRAGシステムを提案。最適化されたハイブリッド検索と軽量な生成モデルを組み合わせ、低リソース環境でも高精度な質問応答を実現する。

EN Proposes an end-to-end Ukrainian RAG system designed for local deployment, combining optimized hybrid search with lightweight generation models to deliver accurate QA in low-resource settings.

arxiv.org