Home›Tags›#ai-evaluation

Tag timeline

#ai-evaluation 1 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Latest timeline Browse categories Open archive

Total 1

Showing 1

Page 1/1

Updated 1h ago

Entries page 1/1 · 1 total

Wed, May 27 1 entries

blog copilot 3w ago ·

zenn-copilot

Opus 4.7 と GPT-5.5 のレビュー特性を統計的に明らかにした（オトナの自由研究 #19） JA Opus 4.7 と GPT-5.5 のレビュー特性を統計的に明らかにした（オトナの自由研究 #19）

重要度 Medium Medium priority 重要度 Medium · 技術記事 · GitHub Copilot Medium priority · technical post · GitHub Copilot 公開 5月27日 Published May 27

AI要約はじめに Opus 4.7 は、「半年後に読める形か」を一歩踏み込んで見る、読み手志向の辛口採点者 GPT-5.5 は、書かれた制約を一字一句そのまま適用する、原則厳守の採点者 #16の結果から、コードレビューはモデルで差が出るという事実が

#copilot #zenn #code-review +5

Opus 4.7 と GPT-5.5 のレビュー特性を統計的に明らかにした（オトナの自由研究 #19）

og fallback