/

Home›Local LLM›13モデル実測比較：HumanEval/HumanEval+でわかるLLMコーディング実力ランキング2026

13モデル実測比較：HumanEval/HumanEval+でわかるLLMコーディング実力ランキング2026 13モデル実測比較：HumanEval/HumanEval+でわかるLLMコーディング実力ランキング2026

Zenn LLM tag · zenn.dev · 2026/05/08 17:06 · 2h ago

AI 3 行サマリ

この記事でわかること HumanEval / HumanEval+ とは何か、どのような仕組みで評価するのか Claude Opus 4.7 / 4.6 / Sonnet 4.6 / Haiku 4.5 と、RTX 3090で動くローカルL

※ この記事の本文は近日中に AI が生成して差し替わります。現時点では上記サマリをご参照ください。

#benchmark #llm #zenn

SourceZenn LLM tagT2
Source Avg ★ 1.1
Typeブログ
Importance ★ 情報 (top 100% in Local LLM)
Half-life 📘 中期 (チュートリアル)
LangJA
Collected2026/05/08 19:00

元記事を読む

zenn.dev

本ページの本文・要約は AI による自動生成です。正確性は元記事 (zenn.dev) をご確認ください。

🏠 Local LLM の他の記事もっと見る →

AIエージェントを段階的に本番投入する：support-onlyからeffect-bearingへの昇格設計

AIエージェントを段階的に本番投入する：support-onlyからeffect-bearingへの昇格設計

zenn-llm 1h ago

Claude Opus 4.7 は AWS 経由だと出力速度が速いのか？

zenn-llm 3h ago

OpenMythosはSLMの業務利用に道を開いたのか？

zenn-llm 4h ago

Claude Code で Agentic Quality Gate Plugin を実装した話

zenn-llm 5h ago

llm-d on Amazon EKS で Prefill/Decode Disaggregation 検証環境を構築する

zenn-llm 5h ago

LoRAとは何か？低コストなAIモデル微調整と、学習後にLoRAを圧縮するPARAの解説

zenn-llm 6h ago

URL をコピーしました