HomeTags#inference-speed

Tag timeline

#inference-speed 1 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 1
Showing 1
Page 1/1
Updated 3h ago

Entries page 1/1 · 1 total

YESTERDAY 1 entries
NEW blog local-llm 21h ago · zenn-llm

ローカルLLM動作比較: gpt-oss vs DiffusionGemma vs Qwen3.5—tok/s は仕事の速さではない A three-way local LLM shootout of gpt-oss, DiffusionGemma, and Qwen3.5 finds that tok/s is…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 7月3日 Published Jul 3

AI要約 gpt-oss、DiffusionGemma、Qwen3.5をローカル環境で比較し、tok/sという速度指標だけでは実際の作業品質を測れないことを検証した記事で、モデル選定の新たな視点を提示している。

EN A three-way local LLM shootout of gpt-oss, DiffusionGemma, and Qwen3.5 finds that tok/s is a misleading benchmark—practical output quality and task accuracy are equally important for real-world usefulness.

fallback