#reasoning-model — TECH Dashboard

Entries page 1/1 · 2 total

Mon, Jun 1 1 entries

blog local-llm 2w ago ·

zenn-llm

GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO JA GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月1日 Published Jun 1

AI要約 ! 最先端AIを技術の中身まで日本語で読み解く「AIウォッチ」の深掘り記事です。一次情報（arXiv 2507.18071 / Qwen公式ブログ）を当たって書いています。推論モデルの強化学習（RL）は、ここ1年で「ベンチマークを何点上げ

#llm #open-model #zenn +6

zenn.dev →

fallback

Tue, Aug 5 1 entries

🔥 HOT blog codex 10mo ago ·

openai-blog

OpenAI、オープンウェイトモデル gpt-oss-120b と gpt-oss-20b を公開 gpt-oss-120b & gpt-oss-20b Model Card

重要度 High High priority 重要度 High · 技術記事 · OpenAI / Codex High priority · technical post · OpenAI / Codex 公開 8月5日 Published Aug 5

AI要約 OpenAIはApache 2.0ライセンスで利用可能なオープンウェイト推論モデル gpt-oss-120b と gpt-oss-20b を公開。モデルカードで性能・安全性評価の詳細を公表した。

EN We introduce gpt-oss-120b and gpt-oss-20b, two open-weight reasoning models available under the Apache 2.0 license and our gpt-oss usage policy.

#openai #open-weights #gpt-oss +5

openai.com →

fallback

#reasoning-model 2 total

Entries page 1/1 · 2 total

GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO JA GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO

OpenAI、オープンウェイトモデル gpt-oss-120b と gpt-oss-20b を公開 gpt-oss-120b & gpt-oss-20b Model Card