チームが考慮すべき 17 の重要なアジャイル メトリクス
公開: 2020-06-02メトリクスは、アジリストの間で長い間議論の的となってきました。
高品質のソフトウェアが継続的に提供されるため、アジャイル開発は経験的であるという事実にもかかわらず、PMO オフィス、プロジェクト マネージャー、およびクライアントは、ウォーターフォール ベースのプロジェクトと同様に、詳細なステータス レポートを要求します。 ビジネス ニーズは見落としの理由の 1 つですが、アジャイル開発自体が、一部の人々が常に特定したい不確実性のレベルに寄与しています。
この傾向に逆行するために、多くのアジャリストは、測定値はまったく使用すべきではなく、ソフトウェア自体の作成のみが成功の尺度と見なされるべきであると主張しています。 このアプローチの支持者は、開発チームとプロジェクト マネージャーは、一見高効率であるかのように見せかけて実際の問題を隠すような方法で、ユーザー ストーリーと見積もりを操作することで、本能的にシステムを操作するだろうと主張しています。 ただし、何が測定され、何が行われるかという格言があります。
このゲームが発生する主な理由は、組織が包括的なメトリクス ソリューションではなく、1 つまたは 2 つのメトリクスに依存しすぎていることです。 この記事では、チームのパフォーマンス、品質、価値、さらには俊敏性について利用可能な最高のインテリジェンスを生み出すことが証明されている指標について説明します。 最新の調査と最も革新的なケース スタディに基づいて、聞いたことがないかもしれないいくつかの指標についても説明します。
アジャイル指標は何に使用されますか?
アジャイル メトリクスは、ステータス、品質、生産性、効率、価値、さらにはアジリティそのものを追跡するために使用されます。 最も重要なことは、ビジネス上の意思決定を通知するために使用されることです。 取り組んでいるプロジェクトの種類に関係なく、レポートは外部と内部の両方の利害関係者にとって常に重要です。 メトリクスは、製品管理から人員配置管理まで、あらゆるレベルで意思決定に影響を与える可能性があるため、正確で有益で偏りのないものである必要があります。 メトリクスに飛び込む前に、まず、そのようなすべての測定の基礎となる基盤を確立する必要があります。
鉄の三角形とアジャイルの三角形
計画ベースのアプローチでは、測定はスコープ、スケジュール、コストの古い「鉄の三角形」に基づいていました。 ほとんどすべてのメトリックは、これら 3 つのカテゴリのいずれかに分類されます。 アジャイルの世界では、この三角形はひっくり返されています。 プロジェクトは、特定の制約内で価値と品質を提供することによって定義されます。 予算やコストは、配信の主な焦点とは対照的に、これらの制約の 1 つにすぎません。
ここで、価値と品質の関係を理解することが重要です。 多くの人が価値の定義に苦労しています。 まず、品質には内在性と外在性の 2 種類があります。
- 本質的な品質は、開発、テスト、および管理チームによる製品の内部認識に関連しています。 これは通常、後で説明する欠陥指標で示されます。
- 外部品質とは、エンドユーザーが認識する製品の品質です。 製品が彼らのニーズにどの程度適合し、期待を満たしているか。 この外部品質の別の用語は、価値です。
したがって、アジャイルの三角形に描かれている品質は、開発の観点から見た本質的または内部的な品質であり、三角形の価値は実際には外的品質の一形態であることを理解することが重要です。 この関係を理解することは、優れたアジャイル対策を開発するために重要です。

追跡すべき 17 の重要なアジャイル メトリクス
次の 17 のメトリクスのリストは、最も頻繁に使用され、古くから使用されているアジャイル メトリクスと、最近の調査に基づく新しいメトリクスを組み合わせたものです。 ここで重要なことは、アジャイル メトリクス ソリューションは包括的でなければならないということです。
1 つまたは 2 つの情報だけに頼っていては、何が起こっているのかを完全に把握することはできません。 多くのマネージャーが犯す最大の過ちは、プロジェクト全体で 2 つまたは 3 つ、あるいは 1 つの指標だけに注目しすぎることです。 一部の組織では、ベロシティ チャートまたはバーンダウン チャートしか使用していません。
信じられないかもしれませんが、それは起こります。 優れたメトリクス ソリューションは、アジャイル トライアングルの 3 つのポイントすべてをカバーする必要があります。 これらの 17 のツールは、それだけでなく、それ以上のことを行うためのツールを提供します。
ブロックされた時間
ブロックされた時間は、特定のユーザー ストーリー (場合によってはタスク) がブロックされている時間として定義されます。 ブロッカーを解決することは、アジャイル環境で作業の流れを促進するために重要であり、このメトリックは、解決にかかる時間を測定するのに役立ちます。 ブロッカーは適切に解決する必要があります。
ブロックされた時間の増加は、ユーザー ストーリーが適切に分解されなかったこと、または計画外の外部リソースへの依存があることを意味する可能性があります。 より慎重なユーザー ストーリーの分解、優先順位付け、およびスプリント計画により、ブロックされた時間を短縮できます。
ビジネスの勢い
ここで説明するメトリックの多くは、かなり前から存在しています。 ほとんどは、プロジェクト、チーム、または WIP (進行中の作業) レベルに焦点を当てています。 しかし、テクノロジーが私たちの日常生活にさらに溶け込み、それらの製品の市場が非常に加速するにつれて、組織は、市場の傾向を特定し、プロセスの改善を評価し、競争を予測し、本質的にアジリティを測定できる、より洗練された指標を求めています。 ビジネスのモメンタムもその 1 つです。 このコンテキストでの勢いは、リリースの合計ストーリー ポイントにそのタイムラインを掛けたものとして表すことができます。
組織の機敏性が高まるにつれて、リリースごとに勢いが増します。 サイクル タイムは短くなる傾向があり、納品に対する期待は高まります。 ビジネスの勢いは、市場のタイミングや、特定の製品ラインやプログラムの健全性を示すマーカーとして使用できます。 勢いが衰え始めた場合、これは経営陣にとって、特定の市場が展開し始めており、新しい製品ラインを開発する必要があることを示しています。 アジャイルな組織は、競争力を維持するために継続的に新しい市場を探し求めなければなりません。


コードカバレッジ
コード カバレッジは、テスト中に実際に実行されているコードの量の尺度です。 これは通常、自動化されたテスト戦略の一部として計測および計算されます。 メトリックは、各テスト フェーズ (ユニット、システムなど) で実行されたコードの全体的な割合と、すべてのフェーズの合計を提供する必要があります。
コード カバレッジは、製品がどれだけ適切にテストされているかを示す指標として悪用されるべきではありません。 むしろ、このメトリックの目標は、テストの自動化を促進し、継続的な配信を監視することです。 品質保証の測定には、さまざまな指標を含める必要があります。そのうちの少なくとも 1 つは、後で説明する欠陥の発生です。
管理図
プロセス動作チャートまたはシューハート チャートと呼ばれることもある管理図は、プロセスのパフォーマンスを監視して、設定されている上限、下限、および平均管理限界に応じて、プロセスが管理されているか管理されていないかを判断します。
これらの制限は、サンプル データの標準偏差を推定し、その偏差に 3 を掛けて、それを平均に加算して上限を作成し、それを平均から減算して下限を作成することによって計算されます。 グラフの Y 軸は特定のサンプルの発生数または問題の数で、X 軸は各サンプルを列挙します。 管理図は、品質管理の一形態として製造業で生まれ、ほぼ 100 年間使用されてきました。
シックス シグマの信奉者に人気のある管理図は、品質管理やその他の製造プロセスの失敗または成功を測定できます。 アジャイルの世界では一般的ではありませんが、管理図を使用して反復またはリリースごとに検出された欠陥を測定し、QA テストの問題を特定したり、一連のリリースのサイクル タイムを測定してそれらが許容レベル内に収まっていることを確認したりできます。
累積フロー図
累積フロー ダイアグラムは、時間の経過とともにチームに割り当てられている作業量を、タイプ別にセグメント化して示します。 その目的は、システム全体での作業の流れを監視することです。 この図では、作業はさまざまな種類に分けられています。たとえば、作業中、進行中、完了などです。 また、要件、開発、テストなどに分割することもできます。 セグメント化されていますが、累積フロー ダイアグラムは各作業タイプの線を示します。Y 軸は作業項目の数、X 軸は時間の関数です。
良好な流れは、これらすべての線が平行に走っていることで示されます。 ラインの 1 つが急激な上昇を経験するか、別のラインを超える場合、これはボトルネックを示している可能性があります。 かんばんの背後にある中心的な概念は、良好な流れを実現することです。 累積フロー図は、ボトルネックを特定して継続的なフローを促進し、システム内のどの時点でも WIP が制御不能にならないようにするのに役立ちます。
サイクルタイム
サイクル タイムは、コンセプトから完成まで、ソフトウェア リリースを作成するのにかかる時間として定義できます。 リード タイムと速度に加えて、サイクル タイムは、アジャイルの健全性とアジャイル トランスフォーメーションの成功を示す非常に優れた高レベルの指標です。 組織がアジャイル ジャーニーを進めるにつれて、サイクル タイムは徐々に短縮され、通常は 6 か月以下になります。 サイクル タイムの増加は、特に 1 回または 2 回のリリースで一貫して観察される場合は、懸念とレビューの原因となるはずです。
エピックとリリースのバーンダウン
エピック バーンダウン チャートとリリース バーンダウン チャートは、以下で説明する人気の高いスプリント バーンダウンに似ています。 バーンダウン チャートは、特定の期間 (この例では特定のエピック) に残っている作業量を示します。 アジャイル開発では、エピックは小さなユーザー ストーリーまたは作業のチャンクで構成される大きなユーザー ストーリーです。
作業が完了すると、エピック内のユーザー ストーリーの数がゼロになるまで徐々に減少します。 これは、契約上の要件を満たし、クライアントに請求するためにマイルストーンに到達する必要がある場合に役立ちます。 同様に、リリース バーンダウンでは、特定のリリースのためにコミットされた作業の進行状況を追跡できます。 これは、納期を確実に守るため、または締め切りを早期に変更する必要があることを特定するために使用できます。

展開の失敗
展開の失敗とは、次のいずれかになるものです。
- 停止に影響するサービス
- 顧客の期待に応えられず、多くの場合、リリースが拒否されます。
- 製品の使いやすさ、操作、またはユーザー エクスペリエンスに深刻な影響を与えます。
- その結果、以前のリリースにロールバックされます。
展開の失敗率 (展開全体に対するパーセンテージとして表示される) は、明らかに最小限に抑える必要があります。 このメトリックの急上昇は、懸念の原因となるはずです。 変更率と欠陥の発生を確認して、根本原因を特定する必要があります。
リードタイム
リードタイムは、タスクが作成された瞬間から終了するまで、タスクを完了するのにかかる時間を測定します。 つまり、物事を完了するのにかかる時間を特定します。 カンバン担当者に人気のあるこの指標は、システム内でタスクをより速く移動する効率を特定するのに役立ちます。 また、継続的デリバリーがどの程度うまく機能しているかを判断するための高レベルの指標としても使用できます。 リード タイムは、サイクル タイムと速度と共に使用して、配送パフォーマンスの全体像を提供できます。
ネットプロモータースコア (NPS)
ネット プロモーター スコアは、顧客満足度の評価に役立てることを目的としています。 通常、調査によって得られたデータに基づいて計算されます。 目標は、何人の顧客があなたの製品を推奨するかを調べることです。 「いいえ」と投票した回答者の割合を「はい」の投票者から差し引いて、スコアを作成します。
顧客満足度を測定するだけでなく、ネット プロモーター スコアは、将来のリリースに向けて革新的な製品や技術で協力することに積極的な顧客を特定するのにも役立ちます。 このような顧客は、顧客のフィードバックとサポートが、企業が競合よりも先に新製品を市場に投入するのに役立つため、競争上の優位性になる可能性があります。
品質インテリジェンス
この記事の冒頭で、アジャイル トライアングルとその中で品質が果たす役割について説明しました。 品質インテリジェンスにはさまざまな形式がありますが、通常はさまざまな欠陥追跡指標で構成されています。 欠陥は、発生する場所と時期、頻度、重大度に基づいて監視できます。
最も一般的なものの 1 つは、リリースで発見された欠陥の総数に対するクライアントによって発見された欠陥の比率である欠陥回避率です。 どのような方法で発見されたとしても、多数の欠陥が懸念されるはずですが、顧客が発見する前に欠陥を発見することが常に最善です。
スプリントのバーンダウン
スプリント バーンダウン チャートは、完了した作業と、特定のスプリントでまだ実行されていない作業の毎日の測定値を提供します。 完了した作業量を元の見積もりと比較します。 アジャイル開発は経験に基づいているため、バーンダウン チャートの価値は非常に限られています。
その人気にもかかわらず、多くのアジャイル コーチは以前ほど使用しないようにしています。 これは、開発チームがコミットメントに反対する場所の良いガイドまたはステータス ポイントとして役立ちますが、何が起こっているかの全体像を把握するために、他の指標と併せて使用する必要があります。
スループット
特定の単位時間あたりに顧客に提供される製品の量 (作業項目の数) は、スループットと呼ばれます。 これは、毎月、四半期ごと、リリースごと、反復ごとなどに測定できます。 このメトリックの値は、特定の時間枠で配信できるソフトウェアの量を判断するために使用できることです。 また、チームや組織の観点から配信の一貫性を追跡するためにも使用できます。
履歴データの経験的分析を使用して、配信パフォーマンスを予測できます。 利用可能な過去のデータが多ければ多いほど、予測がより正確になる可能性が高くなります。 最も重要なことは、提供される機能の価値が財務面でよく理解されていることを考えると、この指標を収益の予測にも使用できることです。 この指標が機能するためには、「完了」の定義を明確に定義する必要があります。 お客様に提供されるソフトウェアのみがこの要件を満たします。
提供される価値
この記事の冒頭で、価値がどのように外部品質、つまりエンド ユーザーからの製品の認識で構成されるかについて説明しました。 製品はクライアントのビジネスにどのような影響を与えますか? 優れたアジャイル メトリクスは成果に基づいており、ビジネスの世界では通常、ドルやセントに換算されます。 必要な作業を見積もる方法として各ユーザー ストーリーにストーリー ポイントを割り当てるのと同じように、相対的な尺度としてバリュー ポイントを追加して、作業が完了したときにエンド ユーザーが得ているものを示すこともできます。
これを行う 1 つの方法は、各ストーリーの完了時に蓄積されるバリュー ポイントの数を示すバーンアップ チャートを使用することです。 受け入れ基準が作成されているため、顧客の認識に基づいて、各ストーリーまたは機能にバリュー ポイントを割り当てることができます。 プロジェクトでクライアントが期待する収益 (または節約できる金額) は、リリースの合計バリュー ポイント数で割ることができます。
たとえば、プロジェクトに 200 のバリュー ポイントがあり、顧客が 100 万ドルの収益を得ると予想される場合、各バリュー ポイントは 5,000 ドルの価値があります。 各ストーリーの合計とその累積値は、バーンアップ グラフで示すことができます。 製品の実際の影響はリリースされるまで明らかにならないかもしれませんが、この方法は、経営陣とクライアントの両方に説得力のある財務情報を提供できます。
速度
ベロシティは、アジャイル開発に触れた後、おそらくほとんどの人が最初に耳にする指標です。 おそらく最も人気のあるアジャイル メトリクスですが、最も誤用されていることもあります。 スプリントチームは、パフォーマンスを報告するために非常に大きく依存しているため、ゲームの速度で悪名高い. 速度は、各イテレーションまたはスプリントで作成されるソフトウェアの量として定義されます。 この量は通常、ストーリー ポイントとして表され、作成されるソフトウェアは、実用的なコードのスライスである必要があります。
チームは多くの場合、ユーザー ストーリーのサイズと見積もりを操作したり、作業を垂直ではなく水平に分解したり、データベースの変更、フロント エンド作業、ミドルウェアなどのストーリーを作成したりして、速度を競います。 他者への依存を排除し、仕事を完了するための信用を得るため。 このアプローチの問題点は、この種のユーザー ストーリーは実際にはタスクであり、チームは功績を認められますが、顧客にとってのビジネス価値は提供されていないことです。
ゲームの速度は、他の多くの指標をチェック アンド バランスとして使用することで防ぐことができます。 多くの場合、組織は、PPM、プログラム、およびプロジェクト管理ソリューションを形成するために、より大きな一連の測定値ではなく、速度または非常に小さな一連のメトリックのみに依存しています。
渦度(機敏)
多くのアジャリストとプロジェクト マネージャーが苦労している質問の 1 つは、「私たちのアジャイル度は?」です。 実際、アジリティ自体を測定するための答えを探すことは、あらゆる場所のアジリストの聖杯でした。 アジャイル渦度は、まさにそれを行う新しい尺度です。 10年以上のケーススタディ研究に基づいて、機敏な渦度は、グラウンデッドセオリーと呼ばれる洗練された定性的方法によって開発されました。
包括的な一連の測定を使用して、市場と組織プロセスの両方のアジリティを相互に比較して測定し、それらの渦度、またはそれらが収束するポイントを決定できます。 渦度ゼロとは、組織の機敏性が市場と一致していることを意味します。 渦度が高いということは、市場が組織やチームよりもはるかに速く動いていることを意味するため、やるべきことがたくさんあります。 以下のインフォグラフィックは、今日の非常に加速した市場を説明するために、ワールプール思考実験を使用してこの関係を示しています。



ワークアイテムの年齢
作業項目は、作業のパッケージ、使用可能な機能、またはほとんどのアジャイル コンテキストでのユーザー ストーリーとして定義できます。 時計は、作業項目が最初に考案されるとすぐにその年齢を刻み始めます。 進行中か未処理かを問わず、作業項目の経過時間を追跡すると、要件に関する問題を特定するのに役立ちます。
ワークアイテムがあるスプリントから次のスプリントに押し出されているために、ワークアイテムがその親族よりも古くなったように見える場合、分解に問題がある可能性があります。 再定義するか、理解を深める必要があるのではないでしょうか? 長期間バックログにある作業項目は、選別または再定義する必要がある場合があります。
継続的なバックログ グルーミングは、スプリントの計画と優先順位付けに不可欠です。 バックログ内の古い要件の数が増えると、要件がどのように開発および分解されるかという問題が発生する可能性があります。 不十分な要件管理は、アジャイル変革の失敗の主な原因の 1 つです。
要件が不適切に記述されていると、優先順位付けと見積もりが非常に難しくなり、制御不能な技術的負債、機能の使用率の低下、および経済的損失につながる可能性があります。 十分に理解され、優先順位が付けられた、価値の高い要件を開発することは、非常に芸術的な形式であり、最高のアジャリストでさえほとんど理解されていません。 実際、アジャイル トランスフォーメーションの成功を阻む最大の要因の 1 つであることはほぼ間違いありません。
結論
この記事では、アジャイル メトリクスの基盤、包括的なソリューションの必要性、およびそれを構築するための 17 の推奨事項を確立しました。 説明したすべての測定値を使用する場合でも、サブセットのみを使用する場合でも、どのソリューションでもデータの対象者を考慮することが重要です。 速度などの一部の指標は、スクラム チーム内で保持するのが最適です。 アジャイルな渦度やビジネスのモメンタムなどのその他の指標は、それぞれエグゼクティブまたは製品管理用に設計されています。
メトリクスが何を言っているのかを常に完全に理解し、正確に伝え、データが導くところに従うようにしてください。 優れた指標を推進してサポートする 1 つの方法は、堅牢なアジャイル フレームワークを使用することです。