HomeTags#llm-training

Tag timeline

#llm-training 7 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 7
Showing 7
Page 1/1
Updated 3h ago

Entries page 1/1 · 7 total

Fri, Jun 26 1 entries
blog agent-fw 6d ago · aws-ml-blog

Amazon SageMaker AIでNVIDIA Blackwellを活用したモデルトレーニングの最適化 Optimize model training on Amazon SageMaker AI with NVIDIA Blackwell

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Agent Frameworks Medium priority · technical post · Agent Frameworks 公開 6月26日 Published Jun 26

AI要約 Amazon SageMaker AI上でNVIDIA Blackwell GPUの性能を最大限に引き出すトレーニングジョブの設定方法を解説し、バッチサイズやシーケンス長の最適化で大規模モデルの学習を効率化する手法を紹介している。

EN This post explains how to configure training jobs on Amazon SageMaker AI to maximize NVIDIA Blackwell GPU performance, offering guidance on selecting batch sizes and sequence lengths for efficient large-model training.

fallback
Tue, Jun 16 1 entries
NEW blog copilot 2w ago · github-blog-ai

多言語AI構築を加速する新しいオープンデータセットをGitHubが公開 Accelerating researchers and developers building multilingual AI with a new open dataset

重要度 Medium Medium priority 重要度 Medium · 技術記事 · GitHub Copilot Medium priority · technical post · GitHub Copilot 公開 6月16日 Published Jun 16

AI要約 GitHubがCC0-1.0ライセンスのリポジトリレベルのオープンデータセットを公開した。README・Issue・PRにわたる多言語の開発者コンテンツを含み、研究者や開発者が多言語AIモデルの学習やNLP研究に活用できる。

EN GitHub released a new CC0-1.0 licensed repository-level dataset of multilingual developer content from READMEs, issues, and pull requests, helping researchers and developers train multilingual AI models.

fallback
Mon, Jun 1 1 entries
paper research 4w ago · arxiv-cs-lg

VeriGate: 検証器ゲーティングによるGRPOのステップレベル監督 VeriGate: Verifier-Gated Step-Level Supervision for GRPO

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 6月1日 Published Jun 1

AI要約 VeriGateは、GRPOの結果報酬が持つ粗さを補うため、検証器でゲーティングしたステップレベルの監督信号を導入する手法。各推論ステップへ細かい報酬を与えることで、推論モデルの学習効率と精度の向上を目指している。

EN VeriGate augments GRPO with verifier-gated step-level supervision to offset the coarseness of outcome-only rewards, aiming to improve the training efficiency and accuracy of reasoning models.

fallback
Thu, May 7 1 entries
NEW blog local-llm 1mo ago · huggingface-blog

vLLM V0からV1へ:RLにおける修正より正確性を優先 vLLM V0 to V1: Correctness Before Corrections in RL

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月7日 Published May 7

AI要約 ServiceNow AIがvLLMをV0からV1に移行した際の強化学習トレーニングで生じた数値的不一致と再現性問題を検証。ロジット計算やバッチ処理の正確性を確認してから修正に進む重要性を示した。

EN ServiceNow AI examined numerical discrepancies and reproducibility issues that arose when migrating vLLM from V0 to V1 for RL training, stressing the need to verify logit and batching correctness before applying corrections.

vLLM V0 to V1: Correctness Before Corrections in RL og fallback
Tue, Mar 10 1 entries
NEW blog local-llm 3mo ago · huggingface-blog

オープンソースRLライブラリ16種に学ぶ非同期学習の現状 Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月10日 Published Mar 10

AI要約 Hugging Faceが16のオープンソース強化学習ライブラリを比較し、LLM向けRL訓練の非同期化やトークン生成効率化の課題を整理。学習と推論の分離やオフポリシー対応でスループットを高める設計パターンを解説する。

EN Hugging Face surveys 16 open-source RL libraries, mapping out how each tackles async training, throughput, and off-policy support to keep tokens flowing. It distills design patterns for separating training and inference in LLM RL workflows.

fallback
Fri, Feb 6 1 entries
NEW blog local-llm 4mo ago · huggingface-blog

SyGra Studio 登場: 合成データ生成のビジュアルツール Introducing SyGra Studio

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月6日 Published Feb 6

AI要約 ServiceNow AI が合成データ生成パイプラインをグラフベースのノードエディタで視覚的に構築できるツール「SyGra Studio」を公開。コードを書かずにデータ生成ワークフローを設計・実行でき、合成データ作成の敷居を下げる。

EN ServiceNow AI launched SyGra Studio, a visual graph-based node editor for building synthetic data generation pipelines, letting users design and run data workflows without writing code.

fallback
Mon, Sep 22 1 entries
🔥 HOT NEW blog codex 9mo ago · openai-news

OpenAIとNVIDIA、10ギガワット規模のNVIDIAシステム導入で戦略的提携を発表 OpenAI and NVIDIA announce strategic partnership to deploy 10 gigawatts of NVIDIA systems

重要度 High High priority 重要度 High · 技術記事 · OpenAI / Codex High priority · technical post · OpenAI / Codex 公開 9月22日 Published Sep 22

AI要約 OpenAIとNVIDIAが戦略的提携を発表。10GW規模のAIデータセンターを構築し、次世代モデルの学習・運用を支える。第1フェーズは2026年開始予定。

EN OpenAI and NVIDIA announce a strategic partnership to deploy 10 gigawatts of AI datacenters powered by NVIDIA systems, with the first phase launching in 2026.

fallback