HomeCategoriesClaude
Cl

Claude

37 articles total 8 in last 7 days ▲ 14% vs prev 7d
RSS
Trend Last 30 days
This week 8 ▲ 14% Last week 7 Daily avg 1.1 Peak 3
Mar 23 Mar 30 Apr 6 Apr 13 Apr 20 Apr 21 ↑today
Blog (24) 直近 7 日間は vivid、それ以前は薄色で表示

All articles 37 total

新着順
TODAY 2 entries
NEW blog claude 33m ago · anthropic-engineering

AnthropicのClaude Code評価において、推論・コーディング・エージェント的タスクでモデル性能を測定する際、インフラ起因のノイ… Infrastructure Noise

AI要約 AnthropicのClaude Code評価において、推論・コーディング・エージェント的タスクでモデル性能を測定する際、インフラ起因のノイズ(ツールのタイムアウト、サンドボックス障害、レート制限等)が結果を歪める問題を分析。ノイズの特定・軽減手法を紹介し、信頼性の高いベンチマーク運用の重要性を論じる。

EN Anthropic discusses how infrastructure noise—tool timeouts, sandbox failures, rate limits, and flaky environments—can distort model evaluations for Claude Code, and shares techniques for identifying and mitigating such noise to produce reliable benchmarks.

anthropic.com
fallback
NEW blog claude 33m ago · anthropic-news

Anthropicは最新モデル「Claude Opus 4.7」を発表した Claude Opus 4.7

AI要約 Anthropicは最新モデル「Claude Opus 4.7」を発表した。前バージョンからコーディング、推論、エージェント的タスクの性能が向上し、フラッグシップモデルとして提供される。

EN Anthropic announced Claude Opus 4.7, its latest flagship model with improved performance in coding, reasoning, and agentic tasks compared to previous versions.

anthropic.com
fallback
Sun, Apr 19 2 entries
Fri, Apr 17 2 entries
Wed, Apr 15 2 entries
Mon, Apr 13 2 entries
Sat, Apr 11 2 entries
Thu, Apr 9 2 entries
Wed, Apr 8 1 entries
Tue, Apr 7 2 entries
Sun, Apr 5 2 entries
Fri, Apr 3 3 entries
Wed, Apr 1 1 entries
Mon, Mar 30 1 entries
Fri, Feb 6 1 entries
Wed, Feb 4 4 entries
Sat, Jan 31 1 entries