#calibration — TECH Dashboard

Entries page 1/1 · 2 total

Tue, May 26 1 entries

paper research 3w ago ·

arxiv-cs-ai

大規模言語モデルにおける信頼度キャリブレーション Confidence Calibration in Large Language Models

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月26日 Published May 26

AI要約 LLMの信頼度キャリブレーションを多様なタスクで調査した事前登録済み研究。モデルの自信度と実際の正確さの整合性を検証。

EN A preregistered study investigates how well large language models calibrate their expressed confidence across diverse tasks, examining alignment between stated certainty and actual accuracy.

#arxiv #paper #calibration +4

arxiv.org →

og fallback

Mon, May 25 1 entries

paper research 3w ago ·

arxiv-cs-lg

言語モデルの生成軌跡から較正された不確実性を読み取る Reading Calibrated Uncertainty from Language Model Trajectories

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月25日 Published May 25

AI要約言語モデルの不確実性定量化において、最大ソフトマックス確率に代わる軌跡ベースの較正手法を提案した研究論文。

EN A research paper proposing trajectory-based methods to extract calibrated uncertainty estimates from language models, moving beyond the default maximum softmax probability (MSP) baseline.

#arxiv #paper #uncertainty-quantification +4

arxiv.org →

fallback

#calibration 2 total

Entries page 1/1 · 2 total

大規模言語モデルにおける信頼度キャリブレーション Confidence Calibration in Large Language Models

言語モデルの生成軌跡から較正された不確実性を読み取る Reading Calibrated Uncertainty from Language Model Trajectories