HomeTags#asr

Tag timeline

#asr 2 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 2
Showing 2
Page 1/1
Updated 3h ago

Entries page 1/1 · 2 total

Wed, May 6 1 entries
NEW blog local-llm 1mo ago · huggingface-blog

Open ASR Leaderboardに非公開データセットを追加してベンチマーク不正対策 Adding Benchmaxxer Repellant to the Open ASR Leaderboard

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月6日 Published May 6

AI要約 Hugging FaceはOpen ASR Leaderboardに非公開テストセットを導入し、公開データへの過学習でスコアを稼ぐベンチマーク不正を防止した。これにより音声認識モデルの真の汎化性能を公平に評価できるようになる。

EN Hugging Face added private test sets to the Open ASR Leaderboard to stop benchmaxxing, where models overfit public data to inflate scores, enabling fairer evaluation of true generalization in speech recognition.

fallback
Sat, Dec 13 1 entries
blog gemini 6mo ago · google-deepmind

Google DeepMind、Gemini音声モデルを刷新し高品質な音声体験を実現 Improved Gemini audio models for powerful voice experiences

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 12月13日 Published Dec 13

AI要約 Google DeepMindはGemini APIとVertex AI向けに改良した音声モデルを発表。ネイティブ音声対話、TTS、音声認識(ASR)を強化し、企業開発者がより自然で表現豊かな音声エージェントを構築できるようにした。

EN Google DeepMind released improved Gemini audio models on Gemini API and Vertex AI, upgrading native audio dialogue, TTS, and ASR so enterprise developers can build more natural, expressive voice agents.

Improved Gemini audio models for powerful voice experiences media fallback