RTO 與 RPO:為什麼恢復目標對 IT 成功很重要

已發表: 2021-01-25

企業意識到 IT 停機將花費更多。

公司必須考慮停機時間的影響,並專注於保持業務運營的連續性。 為此,需要實施適當的業務連續性計劃,以使他們能夠最大限度地減少停機時間或完全避免停機。 通過這種方式,公司可以確保其 IT 基礎架構具有彈性。

在討論業務停機時,您經常會聽到恢復時間目標 (RTO) 和恢復點目標 (RPO)。 對於每個企業來說,全面了解 RTO 和 RPO 以確保從災難中快速恢復至關重要。

我們將討論如何衡量 RTO 和 RPO,這些指標在備份業務連續性計劃中的作用,以及如何定義和實現您的業務的 RTO 和 RPO 目標。

什麼是恢復時間目標 (RTO)?

恢復時間目標 (RTO)是一個關鍵指標,可幫助您計算系統或應用程序在停機後需要多快恢復,以免對業務運營產生重大影響。 簡而言之,RTO 是衡量您可以容忍多少停機時間的指標。

如果發生意外中斷,一兩個系統可能會發生故障,您將面臨停機,直到問題得到解決。 這使您處於需要確定恢復系統的時間以便您的業務操作不會中斷的情況。 這就是 RTO 的用武之地。

定義 RTO 需要了解每個系統的容忍停機時間,對於每個應用程序,您可能會有不同的 RTO。 一旦定義了 RTO 指標,您就可以製定恢復計劃,其中包括從停機時間成功快速恢復所需的恢復策略和技術。

什麼是恢復點目標 (RPO)?

恢復點目標 (RPO)是您設置的指標,用於衡量您的企業可以承受並繼續運行而不會對業務運營產生任何影響的數據丟失量。

要確定 RPO,您需要評估數據的重要性,以了解是否需要恢復所有數據或部分數據,甚至可能存在相對不太重要且不需要恢復的數據。 基於此,您將能夠為您的系統定義 RPO:數據的關鍵程度越高,RPO 的值應該越小。

確定 RPO 是備份計劃的重要組成部分,因為它可以幫助您根據數據的重要性設置備份數據的頻率。

RTO 和 RPO 的區別

RTO 和 RPO 是與備份和災難恢復計劃相關的重要元素。 RTO 和 RPO 都以時間為單位進行定義和測量。 儘管 RTO 和 RPO 聽起來很相似,但還是有一些主要區別:

恢復時間目標 (RTO)

恢復點目標 (RPO)

與恢復前的可容忍停機時間有關

與可容忍的數據丟失有關

與恢復所需的時間有關

與備份頻率有關

與使用最新數據恢復正常有關

與恢復數據的最新程度有關

專注於實現目標所需的恢復技術,包括恢復整個系統或僅恢復應用程序或更細粒度的級別

專注於以適當的時間間隔為您的系統自動備份

使用 RTO 和 RPO 最大限度地減少業務停機時間

IT 停機是由於多種原因造成的,例如係統崩潰、網絡或應用程序故障、勒索軟件攻擊導致的數據丟失或自然災害導致的站點災難。 如果發生上述任何不可預見的情況,它可能會停止您的業務運營,並可能讓您付出更多代價。

應用程序至關重要,需要始終可用。 您的業務的關鍵應用程序出現故障會導致應用程序服務中斷,也會導致數據丟失。 這對您的短期和長期業務運營都有直接影響,並影響您的生產力、收入和品牌。 在某些極端情況下,它甚至可能導致您的公司倒閉。

應用程序的容忍停機時間可能因業務而異,但這裡的關鍵因素是通過快速恢復應用程序的可用性來減少停機時間。

為了讓您的系統及時啟動和運行,每個企業都需要有一個可靠的數據保護策略,即備份和災難恢復計劃。 在為您的企業選擇備份和災難恢復計劃時,您應該尋找能夠提供更短 RTO 和 RPO 的解決方案。 這使您可以通過在需要時恢復系統來最大限度地減少停機時間並確保業務連續性。

忽略 RTO 和 RPO 指標的風險

如果您正確評估和定義它們,RTO 和 RPO 指標將幫助您將與停機相關的風險降至最低。 這些指標應與您的業務恢復目標和服務水平協議 (SLA) 管理保持一致。

如果您沒有正確定義 RTO 和 RPO,它可能會導致從輕微到嚴重的任何級別的風險。 此外,您將無法從所需的時間點恢復數據,這可能會導致數據丟失併中斷業務運營。 最重要的是,您將無法在要求的時間內啟動您的系統。 如果關鍵系統在需要時不可用,這可能會停止業務運營。

在上述兩種情況下,業務運營中斷都可能導致生產力下降。 在最壞的情況下,這將導致收入損失,並可能導致商業聲譽損失等嚴重後果。

如何通過備份和災難恢復計劃實現 RTO 和 RPO

您正在查看的任何備份和災難恢復解決方案都將在其 SLA 中指定其保證的 RPO 和 RTO。 始終確保您選擇的備份和災難恢復解決方案能夠確保您的業務恢復目標:RTO 和 RPO。

備份和災難恢復解決方案提供多種功能來實現您的業務 RTO 和 RPO 目標。 我們將了解您需要在備份和災難恢復解決方案中尋找的一些重要功能,這些功能將幫助您的企業實現接近零的 RTO 和 RPO。

靈活的調度策略

當今的備份和災難恢復解決方案提供靈活的調度策略來為您的應用程序定義 RPO。 計劃策略允許您定期運行自動備份,例如每隔幾分鐘、每隔幾個小時或每天一次。 這使得 RPO 的實施更加容易。

持續數據保護 (CDP)確保每次對系統/應用程序進行更改時,都會立即備份或複制。 這解決了企業可能丟失兩次計劃備份之間生成的數據的問題,並允許您實現零 RPO。 但是,當您為關鍵工作負載啟用 CDP 時,可能會出現性能或穩定性問題,因為它會使用更多資源。 由於這些原因,CDP 被廣泛用於文件級備份。

近乎連續的數據保護可以設置為接近零並定期運行。 這接近於實現 CDP 的效果,並且可以啟用使用基於快照的技術或其他技術執行映像級備份/複製。 市場上的大多數備份和災難恢復解決方案都允許您為關鍵系統實現不到 15 分鐘的接近零的 RPO。

即時恢復能力

您的企業需要一個選項來滿足您可以通過即時恢復實現的接近於零的 RTO 目標。

作為備份和災難恢復計劃的一部分,每個企業都需要的即時恢復功能之一是能夠立即從備份存儲中直接啟動備份計算機作為就緒狀態的虛擬機,以繼續其業務運營。

您可以使用備份存儲上仍採用加密和壓縮格式的備份數據,從最新備份或任何時間點立即啟動虛擬環境中的計算機。 您現在可以在幾分鐘內啟動並運行您的關鍵系統,並確保業務連續性,同時滿足接近零的 RTO。

有了這個,您可以最大限度地減少停機時間,並且您的所有第 1 層任務關鍵型系統繼續運行,而不會對業務產生影響。 稍後,您可以將即時啟動的虛擬機遷移到生產環境以進行永久恢復。

顆粒恢復

粒度恢復在備份和災難恢復計劃中的作用非常重要。 它使您能夠僅恢復您需要的數據。

使用此選項,您可以有選擇地直接從備份中恢復文件或應用程序項目。 如果您不小心刪除了某個文件,您可以輕鬆選擇並恢復該特定文件。 此外,您可以立即恢復特定郵件或郵箱,而無需恢復整個數據庫或應用程序。 現在,您將能夠實現幾分鐘的 RTO。 這節省了時間和資源,因為不必每次都恢復整個機器來恢復單個項目。

帶故障轉移的實時復制

實時復制允許您在另一個站點上創建生產工作負載的精確副本,並經常將更改複製到配置接近零的 RPO 的副本計算機。

如果您的源計算機由於任何中斷或損壞而變得不可用,您可以立即執行故障轉移操作,將生產操作無縫切換到您的副本計算機。 在沒有任何停機時間或影響的情況下,您將能夠繼續您的業務運營,同時滿足您接近零的 RTO 目標。 在 RTO 和 RPO 都接近於零的情況下,您可以利用複制和故障轉移功能並使您的生產工作負載始終可用。

用於災難恢復的異地複制

沒有人能預測災難。 如果發生全站點故障,即使您的本地備份也無法訪問,並使您的業務面臨風險,而無法恢復您的數據。

出於這個原因,最好有一個災難恢復計劃,允許您創建備份的額外副本並將其存儲在遠程位置,可以是本地數據中心或公共雲。 通過異地備份,您可以在發生災難時恢復系統並輕鬆滿足您的業務恢復目標。

結論

備份和災難恢復計劃是處理災難場景的整個過程中極其重要的一部分。 如上所述,在發生災難時確保操作連續性的主要方面之一是在備份和災難恢復計劃中正確指定 RTO 和 RPO 指標。

確定 RTO 和 RPO 值,實施滿足您的業務 SLA 的解決方案,並使您的業務始終可用。