HomeTags#arxiv

#arxiv page 1/2 · 60 total

TODAY 30 entries
NEW paper research 5h ago · arxiv-cs-cl

本論文はファクトチェックのためのマルチモーダル主張抽出手法を提案 Multimodal Claim Extraction for Fact-Checking

AI要約 本論文はファクトチェックのためのマルチモーダル主張抽出手法を提案。テキストと画像を統合し、検証すべき主張を自動抽出することで、従来のテキストのみに依存する手法の限界を克服する。

EN This paper proposes a multimodal claim extraction approach for fact-checking that integrates text and images to automatically identify check-worthy claims, overcoming the limitations of text-only methods.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

Apple Silicon上でポーランド語LLM「Bielik 11B」を対象に、異なるモデルファミリー間での投機的デコーディングを評価した… Cross-Family Speculative Decoding for Polish Language Models on Apple~Silicon: An Empirical Evaluation of Bielik~11B with UAG-Extended MLX-LM

AI要約 Apple Silicon上でポーランド語LLM「Bielik 11B」を対象に、異なるモデルファミリー間での投機的デコーディングを評価した論文。UAG(Universal Assisted Generation)を拡張したMLX-LMを用い、クロスファミリーのドラフトモデル活用による推論高速化を実証的に検証している。

EN Empirical study evaluating cross-family speculative decoding for the Polish LLM Bielik 11B on Apple Silicon, using a UAG-extended MLX-LM to enable draft models from different model families for accelerated inference.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

Brain-CLIPLMは、EEG信号から言語を再構成する新手法を提案する Brain-CLIPLM: Decoding Compressed Semantic Representations in EEG for Language Reconstruction

AI要約 Brain-CLIPLMは、EEG信号から言語を再構成する新手法を提案する。CLIPベースの意味圧縮表現を活用し、脳波から直接テキストを生成可能とする言語デコーディングの精度向上を目指す研究である。

EN Brain-CLIPLM proposes a method for decoding compressed semantic representations from EEG signals to reconstruct language, leveraging CLIP-based embeddings to improve text generation directly from brain activity.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

中国語のマルチモーダル皮肉検出向けの説明可能かつ細粒度ベンチマークCFMSを提案する論文 CFMS: Towards Explainable and Fine-Grained Chinese Multimodal Sarcasm Detection Benchmark

AI要約 中国語のマルチモーダル皮肉検出向けの説明可能かつ細粒度ベンチマークCFMSを提案する論文。画像とテキストを用いた皮肉検出タスクにおいて、検出結果だけでなく根拠となる説明や細かな分類を評価できるデータセットを構築した。

EN This paper proposes CFMS, an explainable and fine-grained benchmark for Chinese multimodal sarcasm detection. It provides image-text data that evaluates not only sarcasm classification but also rationales and fine-grained categorization.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

日本語Webレビューの著者帰属に関する基礎研究 Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

AI要約 日本語Webレビューの著者帰属に関する基礎研究。悪質な投稿者(アクター)分析を目的とし、文体特徴や機械学習手法を用いて匿名レビューの書き手を推定する手法を検討している。

EN A foundational study on authorship attribution for Japanese web reviews, aimed at actor analysis. It explores stylistic features and machine learning approaches to identify writers of anonymous reviews.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

GoCoMAは、LLM生成コードの帰属問題に対し、双曲空間上でコードの構文・意味・実行情報などのマルチモーダル表現を融合する手法を提案する GoCoMA: Hyperbolic Multimodal Representation Fusion for Large Language Model-Generated Code Attribution

AI要約 GoCoMAは、LLM生成コードの帰属問題に対し、双曲空間上でコードの構文・意味・実行情報などのマルチモーダル表現を融合する手法を提案する。階層構造を効率的に捉え、既存手法より高精度にどのLLMがコードを生成したかを特定できる。

EN GoCoMA proposes a hyperbolic multimodal representation fusion method for attributing code generated by large language models, combining syntactic, semantic, and execution features to capture hierarchical structure and outperform existing attribution baselines.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

本論文は、勾配ベースモデルと微分不可能なモデルを強化学習を介して結合する相互協調学習(RCT)を提案する Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning

AI要約 本論文は、勾配ベースモデルと微分不可能なモデルを強化学習を介して結合する相互協調学習(RCT)を提案する。両モデルが互いに教師信号を与え合うことで、異なる性質のモデル間での知識転移と協調的な性能向上を実現する枠組みを示す。

EN This paper proposes Reciprocal Co-Training (RCT), a framework that couples gradient-based and non-differentiable models via reinforcement learning, allowing the two model types to provide mutual supervision signals and jointly improve performance.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

大規模言語モデルの事前学習における「データ混合」手法を包括的に調査したサーベイ論文 Data Mixing for Large Language Models Pretraining: A Survey and Outlook

AI要約 大規模言語モデルの事前学習における「データ混合」手法を包括的に調査したサーベイ論文。オフライン/オンライン手法の分類、評価指標、既存研究の比較を整理し、今後の研究方向性と課題を示す。

EN A survey on data mixing strategies for large language model pretraining, categorizing offline and online methods, reviewing evaluation approaches, and outlining open challenges and future research directions.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

本論文LiFTは、大規模言語モデルにおける指示ファインチューニングが、縦断的(時系列)モデリングの文脈内学習能力を向上させるかを検証する LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

AI要約 本論文LiFTは、大規模言語モデルにおける指示ファインチューニングが、縦断的(時系列)モデリングの文脈内学習能力を向上させるかを検証する。指示調整モデルとベースモデルを比較し、長期的なデータパターン把握への影響を評価した。

EN LiFT investigates whether instruction fine-tuning improves in-context learning performance of large language models on longitudinal modelling tasks, comparing instruction-tuned and base models on capturing temporal data patterns.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

QIAS 2026共有タスク向けに、アラビア語イスラム相続法推論のため多段階QLoRAファインチューニングを適用した研究 QU-NLP at QIAS 2026: Multi-Stage QLoRA Fine-Tuning for Arabic Islamic Inheritance Reasoning

AI要約 QIAS 2026共有タスク向けに、アラビア語イスラム相続法推論のため多段階QLoRAファインチューニングを適用した研究。段階的な学習戦略により、複雑な法的推論タスクで高精度を達成した。

EN QU-NLP's submission to QIAS 2026 applies multi-stage QLoRA fine-tuning for Arabic Islamic inheritance reasoning, achieving strong performance on complex legal reasoning tasks through progressive training.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

本論文は大規模言語モデルの幾何学問題に対する内部表現の頑健性を測定する手法を提案する Measuring Representation Robustness in Large Language Models for Geometry

AI要約 本論文は大規模言語モデルの幾何学問題に対する内部表現の頑健性を測定する手法を提案する。問題文の意味を保った言い換えを与えた際に中間層の埋め込みがどの程度安定するかを分析し、LLMの推論の脆弱性を定量化する。

EN This paper proposes a method for measuring the robustness of internal representations in large language models when solving geometry problems, analyzing how embeddings shift under semantically equivalent rephrasings to quantify reasoning fragility.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

生物医学知識を言語モデルに注入する二つの手法、継続事前学習とGraphRAGを比較した研究 Injecting Structured Biomedical Knowledge into Language Models: Continual Pretraining vs. GraphRAG

AI要約 生物医学知識を言語モデルに注入する二つの手法、継続事前学習とGraphRAGを比較した研究。構造化された医療知識グラフの活用法を検証し、それぞれの性能や適用場面の違いを評価している。

EN This paper compares two approaches for injecting structured biomedical knowledge into language models: continual pretraining and GraphRAG, evaluating their respective performance and use cases.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

本論文HalluSAEは、スパースオートエンコーダ(SAE)を用いて大規模言語モデルの内部表現から幻覚に関連する特徴を抽出し、幻覚の検出を行… HalluSAE: Detecting Hallucinations in Large Language Models via Sparse Auto-Encoders

AI要約 本論文HalluSAEは、スパースオートエンコーダ(SAE)を用いて大規模言語モデルの内部表現から幻覚に関連する特徴を抽出し、幻覚の検出を行う手法を提案する。既存手法より高精度に幻覚を識別でき、解釈可能性も向上させる。

EN HalluSAE proposes using sparse auto-encoders to extract hallucination-related features from LLM internal representations, enabling more accurate and interpretable detection of hallucinations compared to existing methods.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-se

AgentGuard: A Multi-Agent Framework for Robust Package Confusion Detection via Hybrid Search and Metadata-Content Fusion AgentGuard: A Multi-Agent Framework for Robust Package Confusion Detection via Hybrid Search and Metadata-Content Fusion

EN arXiv:2604.16309v1 Announce Type: new Abstract: The proliferation of open-source software (OSS) has made software supply chains prime targets for attacks like Package Confusion, where adversaries publ

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-se

Be a Partner, not a Bystander in Software Engineering Practice: Bridging the Gaps between Academia and Industry Be a Partner, not a Bystander in Software Engineering Practice: Bridging the Gaps between Academia and Industry

EN arXiv:2604.16315v1 Announce Type: new Abstract: Software engineering conferences bring together thousands of academicians and software practitioners so that academic research and professional practice

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-se

Modelling GDPR-based Privacy Requirements with Software Engineering Diagrams: A Systematic Literature Review Modelling GDPR-based Privacy Requirements with Software Engineering Diagrams: A Systematic Literature Review

EN arXiv:2604.16361v1 Announce Type: new Abstract: The application of the General Data Protection Regulation (GDPR) has significantly affected privacy requirements elicitation, modelling, and verificatio

arxiv.org
fallback