RoPE は fp32 以外でも位置を正しく表現できるのか? RoPE は fp32 以外でも位置を正しく表現できるのか?
元記事を読む 古い情報の可能性
AI 3 行サマリ
忙しい人向けのまとめ NF4/FP8 などの weight-only 量子化は RoPE の精度に影響しない(量子化されるのは Linear 層の重みだけ) bf16 に落とすと RoPE 内部の cos 値の大部分が丸めで潰れるが、sin
※ この記事の本文は近日中に AI が生成して差し替わります。現時点では上記サマリをご参照ください。
元記事を読む
zenn.dev
本ページの本文・要約は AI による自動生成です。正確性は元記事 (zenn.dev) をご確認ください。