HomeTags#open-models

#open-models page 1/1 · 1 total

YESTERDAY 1 entries
NEW blog tech-news 1d ago · ars-technica

GoogleのGemma 4、未来トークン予測で最大3倍高速化 Google's Gemma 4 AI models get 3x speed boost by predicting future tokens

AI要約 Googleがオープンモデル「Gemma 4」に投機的デコーディング技術を導入し、推論速度を最大3倍に向上させたと発表した。複数の将来トークンを予測することで、品質を維持しつつ生成効率を大幅に高めている。

EN Google's new Gemma 4 open AI models use speculative decoding to predict multiple future tokens at once, boosting inference speed by up to 3x while maintaining output quality.

arstechnica.com
Google's Gemma 4 AI models get 3x speed boost by predicting future tokens og