NorBERTo: 3310億トークンで訓練されたポルトガル語向けModernBERT NorBERTo: A ModernBERT Model Trained for Portuguese with 331 Billion Tokens Corpus
AI要約 ポルトガル語に特化したModernBERTアーキテクチャの言語モデルNorBERToを発表。3310億トークンの大規模コーパスで訓練され、ポルトガル語NLPタスクでの性能向上を目指す。
EN NorBERTo is a ModernBERT-based language model pretrained for Portuguese on a 331 billion token corpus, aiming to improve performance on Portuguese NLP tasks.