LLMと人間のEEGに共通する感情価軸「彩度規則性」の発見 A Shared Valence Axis Across Modern LLMs and Human EEG: The Saturation Regularity
- 大規模言語モデル(LLM)の内部表現と人間の脳波(EEG)に、感情の正負(感情価)を捉える共通の軸が存在することが示された。
- 研究者らはこの構造的対応を「彩度規則性」と呼び、AIと人間認知の深い整合性を示す証拠として報告している。
English summary
- arXiv:2606.00129v1 Announce Type: new Abstract: Large language models (LLMs) have emerged as powerful representation learners whose internal features increasingly align with human cognition.
- We study
大規模言語モデル(LLM)は単なるテキスト生成器を超え、人間の認知構造を反映した内部表現を持つ可能性が指摘されてきた。この論文はその議論に新たな切り口を加える。LLMの特徴空間と人間の脳波(EEG)データの双方に、感情の正負を捉える共通の軸——「感情価軸(Valence Axis)」——が存在するという発見だ。
研究チームはこの対応関係を「彩度規則性(Saturation Regularity)」と名付けた。感情価とは心理学で用いられる概念で、ある刺激や状態が「快」か「不快」かを連続的なスコアで表したもの。感情の二次元モデル(感情価と覚醒度)の一軸であり、感情研究の基本単位として広く用いられている。今回の発見は、LLMがこの感情価の次元を暗黙的に符号化しており、それが人間の神経活動パターンと構造的に一致することを示唆する。
LLMと神経科学データの整合性をめぐる研究は近年急増している。言語モデルの中間層表現が脳のfMRI応答と相関するという報告や、GPTシリーズの埋め込みが感情ラベルを予測できるという先行研究も存在する。本論文はそれらの流れを継承しつつ、EEGという時間解像度の高いモダリティを用いた点、そして「彩度規則性」という具体的な幾何学的パターンを特定した点で新規性がある。
大規模言語モデル(LLM)の内部表現と人間の脳波(EEG)に、感情の正負(感情価)を捉える共通の軸が存在することが示された。
この規則性の発見は実用的な示唆も持つ。感情に敏感なAIシステムの設計や、感情障害の神経マーカー探索における計算モデルの活用など、認知科学・臨床応用の両面で応用可能性があると見られる。一方で、LLMが「感情を理解している」という強い主張には慎重であるべきで、あくまで表現空間の幾何学的対応が確認されたにとどまる可能性もある。
人間の認知とAIの内部構造が共鳴するという知見は、LLMを単なるツールではなく「認知の鏡」として捉える視点を後押しする。今後、より多様なモデルアーキテクチャや感情次元への拡張研究が期待される分野だ。
Large language models have long been suspected of doing more than pattern-matching over text. A growing body of evidence suggests their internal representations echo structures found in human cognition — and a new paper pushes that idea into the domain of affective neuroscience.
The study, posted to arXiv as 2606.00129, identifies what the authors call the 'Saturation Regularity': a geometric pattern in LLM feature spaces that aligns with the valence dimension of human EEG signals. Valence — the positive-to-negative axis of emotional experience — is one of the foundational constructs in affective psychology, typically paired with arousal to form a two-dimensional model of emotion. Finding a structural analog to this axis inside a language model is a notable claim.
The research sits at the intersection of representational alignment and affective computing, two areas that have seen rapid growth. Prior work has shown correlations between transformer hidden states and fMRI BOLD responses during language comprehension, and several groups have demonstrated that word embeddings carry implicit sentiment geometry. This paper extends the conversation by using EEG — which captures neural dynamics at millisecond resolution — and by naming a specific regularity rather than reporting a diffuse correlation.
The choice of EEG as the neural reference is worth noting. Unlike fMRI, EEG reflects fast temporal dynamics and is sensitive to the rapid fluctuations that characterize emotional processing. If LLM representations track something that shows up in EEG, the alignment is arguably more temporally grounded than previous findings based on slow hemodynamic signals.
arXiv:2606.00129v1 Announce Type: new Abstract: Large language models (LLMs) have emerged as powerful representation learners whose internal features increasingly align with human cognition.
What exactly is the Saturation Regularity? Based on the abstract, it appears to describe a systematic organization within the valence axis — possibly a non-linear saturation effect where emotional extremes are encoded differently from neutral states. The full paper will be needed to evaluate the robustness of the finding across model families and EEG paradigms.
The practical implications are speculative but interesting. Emotion-aware AI systems, clinical tools for detecting affective disorders via language biomarkers, and interpretability research that grounds model internals in human neuroscience could all potentially benefit. That said, the finding should not be over-read as evidence that LLMs 'feel' anything; what is being claimed is a geometric correspondence in representation space, not phenomenological equivalence.
The broader trend here is the gradual convergence of computational linguistics and cognitive neuroscience. As models grow larger and more expressive, the overlap with human neural representations appears to deepen — whether by design, by the shared structure of language itself, or by some combination of both. This paper adds a concrete data point to that ongoing debate and is likely to attract follow-up work examining whether the Saturation Regularity generalizes across architectures, languages, and clinical populations.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (arxiv.org) をご確認ください。