Open ASR Leaderboardに非公開データセットを追加してベンチマーク不正対策 Adding Benchmaxxer Repellant to the Open ASR Leaderboard
重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月6日 Published May 6
AI要約 Hugging FaceはOpen ASR Leaderboardに非公開テストセットを導入し、公開データへの過学習でスコアを稼ぐベンチマーク不正を防止した。これにより音声認識モデルの真の汎化性能を公平に評価できるようになる。
EN Hugging Face added private test sets to the Open ASR Leaderboard to stop benchmaxxing, where models overfit public data to inflate scores, enabling fairer evaluation of true generalization in speech recognition.
fallback