HomePapers / BenchmarksSoro: タジク語向け軽量基盤モデルとチャットボット
Soro: A Lightweight Foundation Model and Chatbot for Tajik
Papers / Benchmarks ⚠ 古い情報の可能性

Soro: タジク語向け軽量基盤モデルとチャットボット Soro: A Lightweight Foundation Model and Chatbot for Tajik

元記事を読む 古い情報の可能性
AI 3 行サマリ
  • タジク語に特化した会話型LLMファミリー「Soro」を発表。
  • 計算資源が限られた環境での実用展開を想定した軽量設計。
English summary
  • arXiv:2605.27379v1 Announce Type: new Abstract: We present Soro, a family of Tajik-specialized conversational large language models (LLMs) designed for real-world deployment under tight compute and co

Soroは、タジク語に特化した会話型大規模言語モデル(LLM)のファミリーで、計算資源やコストが限られた環境での実運用を念頭に設計された軽量基盤モデルです。低リソース言語であるタジク語向けにチャットボット機能を提供する点が特徴です。

タジク語はペルシア語系の言語でありながら、デジタルリソースや対応AIモデルが極めて少ない低リソース言語に分類されます。Soroはこのギャップを埋めることを目的としており、研究コミュニティへの貢献が期待されます。

論文はarXiv(2605.27379)にて公開されています。モデルのアーキテクチャや学習データの詳細、ベンチマーク評価については原文をご確認ください。

Soro is a family of Tajik-specialized conversational large language models introduced to address the lack of AI tooling for Tajik, a low-resource language in the Persian language family. The models are described as lightweight and designed for practical deployment under tight compute and cost constraints, making them potentially suitable for real-world applications in Tajik-speaking regions.

Tajik is spoken primarily in Tajikistan and parts of neighboring countries, yet it remains severely underrepresented in the NLP and LLM landscape. By releasing a dedicated foundation model and chatbot, the Soro project aims to close this gap and support downstream tasks in the language.

The paper is available on arXiv (2605.27379). Specific details on model architecture, training data, parameter counts, and benchmark results should be verified directly at the source, as only the abstract was available at the time of this summary.

  • SourcearXiv cs.AIT2
  • Source Avg ★ 2.0
  • Type論文
  • Importance ★ 通常 (top 93% in Papers / Benchmarks)
  • Half-life 🏛️ 長期 (アーキテクチャ)
  • LangEN
  • Collected2026/05/29 09:00

本ページの本文・要約は AI による自動生成です。正確性は元記事 (arxiv.org) をご確認ください。

🔬 Papers / Benchmarks の他の記事 もっと見る →

URL をコピーしました