HomeTags#sft

#sft page 1/1 · 1 total

TODAY 1 entries
NEW blog gemini 33m ago · google-developers

GoogleはMaxTextにポストトレーニング機能を追加し、単一ホストTPU上で教師ありファインチューニング(SFT)と強化学習(RL)を… MaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUs

AI要約 GoogleはMaxTextにポストトレーニング機能を追加し、単一ホストTPU上で教師ありファインチューニング(SFT)と強化学習(RL)を実行可能にした。これによりLLMのカスタマイズを効率的なTPU環境で手軽に行えるようになる。

EN Google expanded MaxText with post-training features, enabling Supervised Fine-Tuning (SFT) and Reinforcement Learning (RL) on single-host TPUs, making LLM customization more accessible in efficient TPU environments.

developers.googleblog.com
fallback