HomeTags#multimodal

#multimodal page 1/1 · 3 total

TODAY 3 entries
NEW paper research 5h ago · arxiv-cs-cl

本論文はファクトチェックのためのマルチモーダル主張抽出手法を提案 Multimodal Claim Extraction for Fact-Checking

AI要約 本論文はファクトチェックのためのマルチモーダル主張抽出手法を提案。テキストと画像を統合し、検証すべき主張を自動抽出することで、従来のテキストのみに依存する手法の限界を克服する。

EN This paper proposes a multimodal claim extraction approach for fact-checking that integrates text and images to automatically identify check-worthy claims, overcoming the limitations of text-only methods.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-cl

中国語のマルチモーダル皮肉検出向けの説明可能かつ細粒度ベンチマークCFMSを提案する論文 CFMS: Towards Explainable and Fine-Grained Chinese Multimodal Sarcasm Detection Benchmark

AI要約 中国語のマルチモーダル皮肉検出向けの説明可能かつ細粒度ベンチマークCFMSを提案する論文。画像とテキストを用いた皮肉検出タスクにおいて、検出結果だけでなく根拠となる説明や細かな分類を評価できるデータセットを構築した。

EN This paper proposes CFMS, an explainable and fine-grained benchmark for Chinese multimodal sarcasm detection. It provides image-text data that evaluates not only sarcasm classification but also rationales and fine-grained categorization.

arxiv.org
fallback
NEW paper research 5h ago · arxiv-cs-ai

GISTは、インテリジェントな意味的トポロジーを用いて画像とテキストからマルチモーダルな知識抽出と空間的接地(グラウンディング)を同時に行う… GIST: Multimodal Knowledge Extraction and Spatial Grounding via Intelligent Semantic Topology

AI要約 GISTは、インテリジェントな意味的トポロジーを用いて画像とテキストからマルチモーダルな知識抽出と空間的接地(グラウンディング)を同時に行う新しいフレームワークを提案する論文である。意味構造を活用することで精度向上を達成する。

EN GIST is a new framework for simultaneous multimodal knowledge extraction and spatial grounding from images and text, leveraging intelligent semantic topology to improve accuracy.

arxiv.org
fallback