HomeTags#embeddings

#embeddings page 1/1 · 2 total

YESTERDAY 2 entries
paper research 1d ago · arxiv-cs-cl

平均プールのコサイン類似度は長さ不変ではない:長さ不変な代替指標の理論と実証 Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative

AI要約 本論文は、トークン埋め込みを平均プールしてコサイン類似度を計算する一般的手法が、入力長に依存してバイアスを生じることを理論的に示す。著者らは長さ不変な代替指標を提案し、複数ドメインの実験で有効性を確認した。

EN This paper proves that the common practice of computing cosine similarity over mean-pooled token embeddings is biased by sequence length, and proposes a length-invariant alternative validated across multiple domains.

arxiv.org
paper research 1d ago · arxiv-cs-cl

意味埋め込みを社会指標へ:プロキシ前提の妥当性検証 The Proxy Presumption: From Semantic Embeddings to Valid Social Measures

AI要約 LLMの意味埋め込みを社会科学の測定指標として用いる「プロキシ前提」を批判的に検討した論文。埋め込みが構成概念を正しく代理しているかの妥当性検証手順を提案し、社会測定への応用上の落とし穴を整理する。

EN This paper scrutinises the 'proxy presumption' that semantic embeddings from LLMs can serve as valid measures of social constructs, proposing validation procedures and highlighting pitfalls when embeddings are treated as substitutes for traditional social science measurements.

arxiv.org