Cursor Composer 2.5 を Codens の executor lane に追加した話 (Opus の 1/10 コスト + Cursor Composer 2
- Cursor が Composer 2.5 を出した時に最初に目を留めたのは benchmark の絶対値ではなく、 per-attempt cost の桁が 1 つ違うという事実でした。
- SWE-Bench Multilingual で A
著者が Cursor Composer 2.5 に注目したのは、ベンチマークの絶対値よりも per-attempt コストの桁が一つ小さいという点でした。SWE-Bench Multilingual での性能を維持しながら Claude Opus の約1/10のコストで動作するという特性は、大量タスクを自動処理する executor lane に適しています。
Codens はオーケストレーター層と executor lane を分離するアーキテクチャを採用しており、今回の変更では Composer 2.5 を executor として追加する構成が試みられています。コスト効率とタスク成功率のトレードオフを実際の運用で検証した内容が記事の核心と推察されます。
詳細なベンチマーク数値や設定手順、実運用での結果については原文をご確認ください。本記事はZennに公開されており、2026年5月時点の情報です。
The author's attention was drawn not to the raw benchmark score of Cursor Composer 2.5, but to the fact that its per-attempt cost is roughly one-tenth that of Claude Opus. This cost profile makes it an attractive candidate for the executor lane in Codens, an AI coding framework that separates an orchestrator layer from lower-level execution agents tasked with actually writing and running code.
The article documents the process of adding Composer 2.5 as an executor-lane model within Codens, evaluating whether it can maintain acceptable task success rates on SWE-Bench Multilingual while dramatically reducing spend per attempt. The core argument appears to be that high-volume automated coding workflows benefit most from a model positioned at this cost-to-performance sweet spot.
Specific configuration steps, numerical benchmark comparisons, and real-world success metrics are covered in the original Zenn post. Readers interested in replicating the setup or verifying the cost figures should consult the source directly.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (zenn.dev) をご確認ください。