HomeTags#retrieval

#retrieval page 1/1 · 3 total

YESTERDAY 3 entries
paper research 1d ago · arxiv-cs-cl

平均プールのコサイン類似度は長さ不変ではない:長さ不変な代替指標の理論と実証 Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative

AI要約 本論文は、トークン埋め込みを平均プールしてコサイン類似度を計算する一般的手法が、入力長に依存してバイアスを生じることを理論的に示す。著者らは長さ不変な代替指標を提案し、複数ドメインの実験で有効性を確認した。

EN This paper proves that the common practice of computing cosine similarity over mean-pooled token embeddings is biased by sequence length, and proposes a length-invariant alternative validated across multiple domains.

arxiv.org
paper research 1d ago · arxiv-cs-se

CDS4RAG: RAG向け循環二重逐次型ハイパーパラメータ最適化 CDS4RAG: Cyclic Dual-Sequential Hyperparameter Optimization for RAG

AI要約 RAGシステムの性能はチャンクサイズや検索数など多数のハイパーパラメータに依存する。本論文はCDS4RAGと呼ぶ循環的・二重逐次型の最適化手法を提案し、retrieverとgenerator側のパラメータを交互に調整することで効率的に高精度なRAG構成を得る枠組みを示す。

EN This paper proposes CDS4RAG, a cyclic dual-sequential hyperparameter optimization method for Retrieval-Augmented Generation systems that alternately tunes retriever- and generator-side parameters to converge on high-quality configurations more efficiently than joint or random search.

arxiv.org
blog local-llm 1d ago · zenn-llm

RAGが逆効果になる時:医療QAにおける検索拡張の落とし穴 An analysis showing that retrieval-augmented generation (RAG) can sometimes hurt rather th…

AI要約 医療分野の質問応答においてRAGが必ずしも精度向上に寄与せず、むしろ性能を下げるケースがあることを指摘した記事。検索ノイズやモデル本来の知識との干渉が原因と考えられ、RAG設計の前提を見直す必要性を論じている。

EN An analysis showing that retrieval-augmented generation (RAG) can sometimes hurt rather than help medical question answering, due to noisy retrieved context interfering with the model's parametric knowledge.

zenn.dev