HomeTags#reasoning-model

Tag timeline

#reasoning-model 2 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 2
Showing 2
Page 1/1
Updated 1h ago

Entries page 1/1 · 2 total

Mon, Jun 1 1 entries
blog local-llm 2w ago · zenn-llm

GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO JA GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月1日 Published Jun 1

AI要約 ! 最先端AIを技術の中身まで日本語で読み解く「AIウォッチ」の深掘り記事です。一次情報(arXiv 2507.18071 / Qwen公式ブログ)を当たって書いています。 推論モデルの強化学習(RL)は、ここ1年で「ベンチマークを何点上げ

fallback
Tue, Aug 5 1 entries
🔥 HOT blog codex 10mo ago · openai-blog

OpenAI、オープンウェイトモデル gpt-oss-120b と gpt-oss-20b を公開 gpt-oss-120b & gpt-oss-20b Model Card

重要度 High High priority 重要度 High · 技術記事 · OpenAI / Codex High priority · technical post · OpenAI / Codex 公開 8月5日 Published Aug 5

AI要約 OpenAIはApache 2.0ライセンスで利用可能なオープンウェイト推論モデル gpt-oss-120b と gpt-oss-20b を公開。モデルカードで性能・安全性評価の詳細を公表した。

EN We introduce gpt-oss-120b and gpt-oss-20b, two open-weight reasoning models available under the Apache 2.0 license and our gpt-oss usage policy.

fallback