GoogleのGemma 4、未来トークン予測で最大3倍高速化 Google's Gemma 4 AI models get 3x speed boost by predicting future tokens
AI 3 行サマリ
- Googleがオープンモデル「Gemma 4」に投機的デコーディング技術を導入し、推論速度を最大3倍に向上させたと発表した。
- 複数の将来トークンを予測することで、品質を維持しつつ生成効率を大幅に高めている。
English summary
- Google's new Gemma 4 open AI models use speculative decoding to predict multiple future tokens at once, boosting inference speed by up to 3x while maintaining output quality.
※ この記事の本文は近日中に AI が生成して差し替わります。現時点では上記サマリをご参照ください。
元記事を読む
arstechnica.com
本ページの本文・要約は AI による自動生成です。正確性は元記事 (arstechnica.com) をご確認ください。