HomePapers / BenchmarksDORAソフトウェアデリバリ指標の歴史と進化

DORAソフトウェアデリバリ指標の歴史と進化 A history of DORA’s software delivery metrics

元記事を読む 鮮度 OK
AI 3 行サマリ
  • DORAが10年以上にわたり研究してきたソフトウェアデリバリ指標の変遷を振り返る記事。
  • デプロイ頻度やリードタイムなど4つの主要指標の成立経緯と、信頼性指標の追加など近年の改訂を解説している。
English summary
  • DORA’s software delivery performance metrics have evolved over time to reflect the changing technology landscape.
  • Learn about the transition from the four keys to the current five-metric model.

DevOps Research and Assessment(DORA)は10年以上にわたり、ソフトウェアデリバリのパフォーマンスを定量的に測定する研究を続けてきた。本記事はその指標群がいかに形成され、改訂されてきたかを振り返るものだ。

DORAが世に広めた4つの主要指標は、デプロイ頻度、変更のリードタイム、変更失敗率、サービス復旧時間である。これらは『State of DevOps Report』および書籍『Accelerate』を通じて広く知られるようになり、スループット(速さ)と安定性(質)の両軸を同時に高めるハイパフォーマンスチームの存在を統計的に示した点で画期的だった。両者はトレードオフではなく相関するという発見は、ソフトウェア工学の通念を覆すものであった。

その後、指標群は静的なものではなく継続的に磨かれてきた。例えば変更失敗率の定義はチームが解釈しやすいよう調整され、信頼性に関する第5の指標が追加された経緯がある。これは速度と安定性を改善した結果として運用上の信頼性が必ずしも高まらないケースが観察されたためで、運用視点を統合する意図があると見られる。

デプロイ頻度やリードタイムなど4つの主要指標の成立経緯と、信頼性指標の追加など近年の改訂を解説している。
🔬 Papers / Benchmarks · 本記事のポイント

関連知見として、DORA指標は現在GoogleのDevOpsプラクティス評価フレームワークの中核を成し、Four Keysと呼ばれるオープンソース計測ツールも提供されている。GitHubやGitLab、Jellyfish、LinearBなどのベンダーも自社プロダクトにDORAメトリクス計測機能を組み込んでおり、業界標準としての地位を確立しつつある。一方で、指標を目標化してしまうことによるGoodhartの法則的な弊害(数値ハック)への懸念も指摘されており、文化や能力モデル(Capabilities)と組み合わせて運用することが推奨されている。

For more than a decade, the DevOps Research and Assessment (DORA) program has been quantifying what makes software delivery effective. This retrospective post walks through how its now-famous metrics came into being and how they have been refined over time.

The four key metrics that DORA popularized — deployment frequency, lead time for changes, change fail rate, and time to restore service — emerged from years of survey-based research published in the State of DevOps Reports and synthesized in the book Accelerate. Their lasting contribution was statistical evidence that throughput and stability are not opposing forces: elite teams achieve both simultaneously. That insight challenged a long-held assumption that moving faster necessarily meant breaking more things, and it gave engineering leaders a defensible framework for investment decisions.

The metrics have not been static. Definitions have been clarified — for instance, change fail rate has been reworded over the years to reduce ambiguity for survey respondents — and a fifth metric focused on operational reliability was eventually added. The reasoning, as reported by the DORA team, is that some organizations improved delivery speed and stability without correspondingly improving the user-perceived reliability of their services, suggesting that the original four metrics did not fully capture the operational dimension.

DORA’s software delivery performance metrics have evolved over time to reflect the changing technology landscape.
🔬 Papers / Benchmarks · Key takeaway

The broader ecosystem reflects how influential these measurements have become. Google maintains an open-source project called Four Keys that automates collection from CI/CD pipelines, and commercial vendors including GitHub, GitLab, Jellyfish, LinearB, and Sleuth ship DORA dashboards out of the box. The metrics have effectively become an industry lingua franca for engineering productivity discussions at the executive level.

That ubiquity has prompted healthy debate. Critics warn of a Goodhart's law dynamic — when a measure becomes a target, it ceases to be a good measure — and point out that gaming deployment frequency or batching failures into single incidents is trivially easy. The DORA team itself has consistently emphasized that the metrics are most useful when paired with the program's broader capability model, which examines technical, process, and cultural practices that drive the outcomes. Looking ahead, it seems likely that future iterations will continue to expand beyond pure delivery, possibly incorporating developer experience and AI-assisted development signals as those areas mature.

  • SourceDORA Insights (Google)T2
  • Source Avg ★ 1.8
  • Typeブログ
  • Importance ★ 通常 (top 97% in Papers / Benchmarks)
  • Half-life 🏛️ 長期 (アーキテクチャ)
  • LangEN
  • Collected2026/06/30 22:00

本ページの本文・要約は AI による自動生成です。正確性は元記事 (dora.dev) をご確認ください。

🔬 Papers / Benchmarks の他の記事 もっと見る →

URL をコピーしました