GoogleのGemma 4、未来トークン予測で最大3倍高速化 Google's Gemma 4 AI models get 3x speed boost by predicting future tokens
AI要約 Googleがオープンモデル「Gemma 4」に投機的デコーディング技術を導入し、推論速度を最大3倍に向上させたと発表した。複数の将来トークンを予測することで、品質を維持しつつ生成効率を大幅に高めている。
EN Google's new Gemma 4 open AI models use speculative decoding to predict multiple future tokens at once, boosting inference speed by up to 3x while maintaining output quality.
og