多言語AI構築を加速する新しいオープンデータセットをGitHubが公開 Accelerating researchers and developers building multilingual AI with a new open dataset
AI要約 GitHubがCC0-1.0ライセンスのリポジトリレベルのオープンデータセットを公開した。README・Issue・PRにわたる多言語の開発者コンテンツを含み、研究者や開発者が多言語AIモデルの学習やNLP研究に活用できる。
EN GitHub released a new CC0-1.0 licensed repository-level dataset of multilingual developer content from READMEs, issues, and pull requests, helping researchers and developers train multilingual AI models.