RTO 対 RPO: IT の成功にとってリカバリ目標が重要な理由
公開: 2021-01-25企業は、IT のダウンタイムのコストが高くなることを認識しています。
企業は、ダウンタイムの影響を考慮し、業務の継続性を維持することに集中する必要があります。 これを行うには、適切な事業継続計画を実装して、ダウンタイムを最小限に抑えるか、完全に回避できるようにする必要があります。 このようにして、企業は IT インフラストラクチャの回復力を確保できます。
ビジネスのダウンタイムについて話し合うとき、目標復旧時間 (RTO) と目標復旧時点 (RPO) について耳にすることがよくあります。 災害から迅速に復旧できるようにするには、すべての企業にとって RTO と RPO を完全に理解することが重要です。
RTO と RPO を測定する方法、バックアップ事業継続計画におけるこれらの指標の役割、およびビジネスの RTO と RPO の目標を定義して達成する方法について説明します。
目標復旧時間 (RTO) とは何ですか?
目標復旧時間 (RTO)は、ビジネス オペレーションに重大な影響を与えないように、ダウンタイム後にシステムまたはアプリケーションを復旧する必要がある時間を計算するのに役立つ重要な指標です。 つまり、RTO は、許容できるダウンタイムの尺度です。
予期しない停止が発生した場合、1 つまたは 2 つのシステムに障害が発生する可能性があり、これが解決されるまでダウンタイムに直面することになります。 これにより、ビジネス オペレーションが中断されないように、システムを復元する必要がある時間を決定する必要がある状況になります。 ここで RTO の出番です。
RTO を定義するには、各システムの許容ダウンタイムを理解する必要があり、アプリケーションごとに異なる RTO を持つ可能性があります。 RTO メトリックを定義すると、ダウンタイムからの迅速な復元を成功させるために必要な復旧戦略とテクノロジを含む、復旧の計画を立てる準備が整います。
目標復旧時点 (RPO) とは何ですか?
目標復旧時点 (RPO)は、ビジネスが耐えることができるデータ損失の量に対して設定するメトリックであり、ビジネス オペレーションに影響を与えることなく機能し続けることができます。
RPO を決定するには、データの重要性を評価して、すべてのデータを回復する必要があるか、一部を回復する必要があるかを判断する必要があります。比較的重要性が低く、復元する必要のないデータが存在する場合もあります。 これに基づいて、システムの RPO を定義できます。データの重要度が高いほど、RPO の値は小さくなります。
RPO を決定することは、重要度に基づいてデータをバックアップする頻度を設定するのに役立つため、バックアップ計画の重要な部分です。
RTO と RPO の違い
RTO と RPO は、バックアップおよび災害復旧計画に関連する重要な要素です。 RTO と RPO は両方とも定義され、時間単位で測定されます。 RTO と RPO は似ているように聞こえるかもしれませんが、いくつかの大きな違いがあります。
目標復旧時間 (RTO) | 目標復旧時点 (RPO) |
復旧までの許容ダウンタイムに関するもの | 許容可能なデータ損失に関連する |
復元にかかる時間に関連する | バックアップ頻度に関連 |
最新データでの正常復帰関連 | 復元されたデータがどのくらい最新のものになるかに関連 |
システム全体、アプリケーションのみ、またはより詳細なレベルのリストアなど、目標を達成するために必要なリカバリ テクノロジーに重点を置いています。 | 適切な間隔でシステムのバックアップを自動化することに重点を置いています |
RTO と RPO を使用してビジネスのダウンタイムを最小限に抑える
IT のダウンタイムは、システムのクラッシュ、ネットワークまたはアプリケーションの障害、ランサムウェア攻撃によるデータ損失、自然災害によるサイトの災害など、さまざまな理由で発生します。 前述の不測の事態が発生した場合、ビジネスの運営が停止し、さらに多くの費用がかかる可能性があります。
アプリケーションは重要であり、常に利用可能である必要があります。 ビジネスの重要なアプリケーションに障害が発生すると、アプリケーション サービスが中断され、データが失われます。 これは、短期的および長期的に事業運営に直接的な影響を与え、生産性、収益、およびブランドに影響を与えます。 極端な場合には、会社が倒産することさえあります。
アプリケーションの許容ダウンタイムはビジネスによって異なりますが、ここで重要な要素は、アプリケーションの可用性を迅速に復元してダウンタイムを短縮することです。
システムをタイムリーに稼働させるには、すべての企業が確実なデータ保護戦略、つまりバックアップと災害復旧計画を策定する必要があります。 ビジネスのバックアップおよび災害復旧計画を選択するときは、RTO と RPO がより短いソリューションを探す必要があります。 これにより、ダウンタイムを最小限に抑え、必要に応じてシステムを復元することでビジネスの継続性を確保できます。
RTO および RPO メトリックを無視するリスク
RTO および RPO メトリックを正しく評価および定義すると、ダウンタイムに関連するリスクを最小限に抑えることができます。 これらの指標は、ビジネスの回復目標とサービス レベル アグリーメント (SLA) の管理に合わせて調整する必要があります。
RTO と RPO を適切に定義しないと、軽度から重大まで、あらゆるレベルのリスクにつながる可能性があります。 さらに、必要な時点からデータを復元することができなくなり、データが失われ、業務が中断される可能性があります。 その上、必要な時間内にシステムを立ち上げることができません。 重要なシステムが必要なときに利用できない場合、これにより業務が停止する可能性があります。

上記のいずれの場合も、業務の中断は生産性の損失につながる可能性があります。 最悪の場合、これは収益の損失につながり、ビジネスの評判を失うなどの深刻な影響を引き起こす可能性があります.
バックアップと災害復旧計画で RTO と RPO を達成する方法
検討しているバックアップおよびディザスタ リカバリ ソリューションは、SLA で保証された RPO と保証された RTO を指定します。 選択したバックアップおよびディザスター リカバリー ソリューションが、ビジネス リカバリーの目的である RTO と RPO を確実に達成できるように常に確認してください。
バックアップおよび災害復旧ソリューションは、ビジネスの RTO および RPO の目標を達成するための複数の機能を提供します。 ビジネスがほぼゼロの RTO と RPO を達成するのに役立つバックアップおよび災害復旧ソリューションで探す必要がある重要な機能のいくつかを見ていきます。
柔軟なスケジューリング ポリシー
今日のバックアップおよびディザスタ リカバリ ソリューションは、アプリケーションの RPO を定義するための柔軟なスケジューリング ポリシーを提供します。 スケジュール ポリシーを使用すると、数分ごと、数時間ごと、または 1 日 1 回などの定期的な間隔で自動バックアップを実行できます。 これにより、RPO の実装がはるかに簡単になります。
継続的データ保護 (CDP)により、システム/アプリケーションに変更が加えられるたびに、即座にバックアップまたは複製されます。 これにより、企業が 2 つのスケジュールされたバックアップの間に生成されたデータを失うリスクがあるという問題が解決され、ゼロ RPO を達成できます。 ただし、重要なワークロードに対して CDP を有効にすると、より多くのリソースを使用するため、パフォーマンスまたは安定性の問題が発生する可能性があります。 これらの理由から、CDP はファイル レベルのバックアップに広く使用されています。
ほぼ継続的なデータ保護は、ほぼゼロに設定して定期的に実行できます。 これは、CDP の効果を達成するのに近く、スナップショット ベースのテクノロジなどを使用したイメージ レベルのバックアップ/レプリケーションを実行するために有効にすることができます。 市場に出回っているほとんどのバックアップおよびディザスタ リカバリ ソリューションでは、重要なシステムで 15 分未満というほぼゼロの RPO を達成できます。
インスタントリカバリ機能
ビジネスには、インスタント リカバリによって達成できるほぼゼロの RTO 目標を達成するためのオプションが必要です。
すべての企業がバックアップおよびディザスタ リカバリ計画の一環として必要とするインスタント リカバリ機能の 1 つは、バックアップされたマシンをバックアップ ストレージから直接、準備完了状態の仮想マシンとして即座に起動し、ビジネス オペレーションを継続できる機能です。
バックアップ ストレージに暗号化および圧縮された形式のままであるバックアップ データを使用して、最新のバックアップまたは任意の時点から、仮想環境でマシンをすぐに起動できます。 重要なシステムを数分以内に起動して実行し、ほぼゼロの RTO を達成しながらビジネスの継続性を確保できるようになりました。
これにより、ダウンタイムを最小限に抑えることができ、Tier 1 のミッション クリティカルなシステムはすべて、ビジネスに影響を与えることなく運用を続けることができます。 すぐに起動した仮想マシンを後で本番環境に移行して、永続的なリカバリを行うことができます。
粒状回復
バックアップおよび災害復旧計画における個別復旧の役割は、重要な役割を果たします。 必要なデータのみを復元する機能を提供します。
このオプションを使用すると、ファイルまたはアプリケーション項目をバックアップから直接選択的に復元できます。 誤ってファイルを削除してしまった場合でも、その特定のファイルを簡単に選択して復元できます。 また、データベースまたはアプリケーション全体を回復する必要はなく、特定のメールまたはメールボックスをすぐに復元できます。 これで、数分の RTO を達成できるようになります。 これにより、個々のアイテムを回復するために毎回マシン全体を復元する必要がないため、時間とリソースが節約されます。
フェールオーバーを伴うライブ レプリケーション
ライブ レプリケーションを使用すると、本番ワークロードの正確なコピーを別のサイトに作成し、ほぼゼロの RPO を構成するレプリカ マシンに変更を頻繁にレプリケートできます。
障害や破損によりソース マシンが使用できなくなった場合は、運用操作をレプリカ マシンにシームレスに切り替えるフェールオーバー操作をすぐに実行できます。 ダウンタイムや影響なしで、ほぼゼロの RTO 目標を達成しながら、ビジネス オペレーションを継続できます。 RTO と RPO の両方がゼロに近い場合は、レプリケーションとフェイルオーバー機能を活用して、本番環境のワークロードを常に利用できる状態に保つことができます。
ディザスタ リカバリ用のオフサイト コピー
災害は誰にも予測できません。 サイト全体で障害が発生すると、ローカル バックアップにさえアクセスできなくなり、データを回復できずにビジネスが危険にさらされます。
このため、バックアップの追加コピーを作成し、それをローカル データ センターまたはパブリック クラウドのいずれかのリモート ロケーションに保存できる災害復旧計画を立てることをお勧めします。 オフサイト バックアップを使用すると、災害が発生した場合にシステムを回復し、ビジネスの回復目標を容易に達成できます。
結論
バックアップおよび災害復旧計画は、災害シナリオに対処する全体的なプロセスの非常に重要な部分です。 前述のように、障害発生時に運用の継続性を確保するための主要な側面の 1 つは、バックアップおよび災害復旧計画で RTO および RPO メトリックを正しく指定することです。
RTO と RPO の値を決定し、ビジネス SLA を満たすソリューションを実装して、ビジネスを常に利用できる状態に保ちます。