RTO 与 RPO:为什么恢复目标对 IT 成功很重要

已发表: 2021-01-25

企业意识到 IT 停机将花费更多。

公司必须考虑停机时间的影响,并专注于保持业务运营的连续性。 为此,需要实施适当的业务连续性计划,以使他们能够最大限度地减少停机时间或完全避免停机。 通过这种方式,公司可以确保其 IT 基础架构具有弹性。

在讨论业务停机时,您经常会听到恢复时间目标 (RTO) 和恢复点目标 (RPO)。 对于每个企业来说,全面了解 RTO 和 RPO 以确保从灾难中快速恢复至关重要。

我们将讨论如何衡量 RTO 和 RPO,这些指标在备份业务连续性计划中的作用,以及如何定义和实现您的业务的 RTO 和 RPO 目标。

什么是恢复时间目标 (RTO)?

恢复时间目标 (RTO)是一个关键指标,可帮助您计算系统或应用程序在停机后需要多快恢复,以免对业务运营产生重大影响。 简而言之,RTO 是衡量您可以容忍多少停机时间的指标。

如果发生意外中断,一两个系统可能会发生故障,您将面临停机,直到问题得到解决。 这使您处于需要确定恢复系统的时间以便您的业务操作不会中断的情况。 这就是 RTO 的用武之地。

定义 RTO 需要了解每个系统的容忍停机时间,对于每个应用程序,您可能会有不同的 RTO。 一旦定义了 RTO 指标,您就可以制定恢复计划,其中包括从停机时间成功快速恢复所需的恢复策略和技术。

什么是恢复点目标 (RPO)?

恢复点目标 (RPO)是您设置的指标,用于衡量您的企业可以承受并继续运行而不会对业务运营产生任何影响的数据丢失量。

要确定 RPO,您需要评估数据的关键性,以了解是否需要恢复所有数据或部分数据,甚至可能存在相对不太重要且不需要恢复的数据。 基于此,您将能够为您的系统定义 RPO:数据的关键程度越高,RPO 的值应该越小。

确定 RPO 是备份计划的重要组成部分,因为它可以帮助您根据数据的重要性设置备份数据的频率。

RTO 和 RPO 的区别

RTO 和 RPO 是与备份和灾难恢复计划相关的重要元素。 RTO 和 RPO 都以时间为单位进行定义和测量。 尽管 RTO 和 RPO 听起来很相似,但还是有一些主要区别:

恢复时间目标 (RTO)

恢复点目标 (RPO)

与恢复前的可容忍停机时间有关

与可容忍的数据丢失有关

与恢复所需的时间有关

与备份频率有关

与使用最新数据恢复正常有关

与恢复数据的最新程度有关

专注于实现目标所需的恢复技术,包括恢复整个系统或仅恢复应用程序或更细粒度的级别

专注于以适当的时间间隔为您的系统自动备份

使用 RTO 和 RPO 最大限度地减少业务停机时间

IT 停机是由于多种原因造成的,例如系统崩溃、网络或应用程序故障、勒索软件攻击导致的数据丢失或自然灾害导致的站点灾难。 如果发生上述任何不可预见的情况,它可能会停止您的业务运营,并可能让您付出更多代价。

应用程序至关重要,需要始终可用。 您的业​​务的关键应用程序出现故障会导致应用程序服务中断,也会导致数据丢失。 这对您的短期和长期业务运营都有直接影响,并影响您的生产力、收入和品牌。 在某些极端情况下,它甚至可能导致您的公司倒闭。

应用程序的容忍停机时间可能因业务而异,但这里的关键因素是通过快速恢复应用程序的可用性来减少停机时间。

为了让您的系统及时启动和运行,每个企业都需要有一个可靠的数据保护策略,即备份和灾难恢复计划。 在为您的企业选择备份和灾难恢复计划时,您应该寻找能够提供更短 RTO 和 RPO 的解决方案。 这使您可以通过在需要时恢复系统来最大限度地减少停机时间并确保业务连续性。

忽略 RTO 和 RPO 指标的风险

如果您正确评估和定义它们,RTO 和 RPO 指标将帮助您将与停机相关的风险降至最低。 这些指标应与您的业务恢复目标和服务水平协议 (SLA) 管理保持一致。

如果您没有正确定义 RTO 和 RPO,它可能会导致从轻微到严重的任何级别的风险。 此外,您将无法从所需的时间点恢复数据,这可能会导致数据丢失并中断业务运营。 最重要的是,您将无法在要求的时间内启动您的系统。 如果关键系统在需要时不可用,这可能会停止业务运营。

在上述两种情况下,业务运营中断都可能导致生产力下降。 在最坏的情况下,这将导致收入损失,并可能导致商业声誉损失等严重后果。

如何通过备份和灾难恢复计划实现 RTO 和 RPO

您正在查看的任何备份和灾难恢复解决方案都将在其 SLA 中指定其保证的 RPO 和 RTO。 始终确保您选择的备份和灾难恢复解决方案能够确保您的业务恢复目标:RTO 和 RPO。

备份和灾难恢复解决方案提供多种功能来实现您的业务 RTO 和 RPO 目标。 我们将了解您需要在备份和灾难恢复解决方案中寻找的一些重要功能,这些功能将帮助您的企业实现接近零的 RTO 和 RPO。

灵活的调度策略

当今的备份和灾难恢复解决方案提供灵活的调度策略来为您的应用程序定义 RPO。 计划策略允许您定期运行自动备份,例如每隔几分钟、每隔几个小时或每天一次。 这使得 RPO 的实施更加容易。

持续数据保护 (CDP)确保每次对系统/应用程序进行更改时,都会立即备份或复制。 这解决了企业可能丢失两次计划备份之间生成的数据的问题,并允许您实现零 RPO。 但是,当您为关键工作负载启用 CDP 时,可能会出现性能或稳定性问题,因为它会使用更多资源。 由于这些原因,CDP 被广泛用于文件级备份。

近乎连续的数据保护可以设置为接近零并定期运行。 这接近于实现 CDP 的效果,并且可以启用使用基于快照的技术或其他技术执行映像级备份/复制。 市场上的大多数备份和灾难恢复解决方案都允许您为关键系统实现不到 15 分钟的接近零的 RPO。

即时恢复能力

您的企业需要一个选项来满足您可以通过即时恢复实现的接近于零的 RTO 目标。

作为备份和灾难恢复计划的一部分,每个企业都需要的即时恢复功能之一是能够立即从备份存储中直接启动备份计算机作为就绪状态的虚拟机,以继续其业务运营。

您可以使用备份存储上仍采用加密和压缩格式的备份数据,从最新备份或任何时间点立即启动虚拟环境中的计算机。 您现在可以在几分钟内启动并运行您的关键系统,并确保业务连续性,同时满足接近零的 RTO。

有了这个,您可以最大限度地减少停机时间,并且您的所有第 1 层任务关键型系统继续运行,而不会对业务产生影响。 稍后,您可以将即时启动的虚拟机迁移到生产环境以进行永久恢复。

颗粒恢复

粒度恢复在备份和灾难恢复计划中的作用非常重要。 它使您能够仅恢复您需要的数据。

使用此选项,您可以有选择地直接从备份中恢复文件或应用程序项目。 如果您不小心删除了某个文件,您可以轻松选择并恢复该特定文件。 此外,您可以立即恢复特定邮件或邮箱,而无需恢复整个数据库或应用程序。 现在,您将能够实现几分钟的 RTO。 这节省了时间和资源,因为不必每次都恢复整个机器来恢复单个项目。

带故障转移的实时复制

实时复制允许您在另一个站点上创建生产工作负载的精确副本,并经常将更改复制到配置接近零的 RPO 的副本计算机。

如果您的源计算机由于任何中断或损坏而变得不可用,您可以立即执行故障转移操作,将生产操作无缝切换到您的副本计算机。 在没有任何停机时间或影响的情况下,您将能够继续您的业务运营,同时满足您接近零的 RTO 目标。 在 RTO 和 RPO 都接近于零的情况下,您可以利用复制和故障转移功能并使您的生产工作负载始终可用。

用于灾难恢复的异地复制

没有人能预测灾难。 如果发生全站点故障,即使您的本地备份也无法访问,并使您的业务面临风险,而无法恢复您的数据。

出于这个原因,最好有一个灾难恢复计划,允许您创建备份的额外副本并将其存储在远程位置,可以是本地数据中心或公共云。 通过异地备份,您可以在发生灾难时恢复系统并轻松满足您的业务恢复目标。

结论

备份和灾难恢复计划是处理灾难场景的整个过程中极其重要的一部分。 如上所述,在发生灾难时确保操作连续性的主要方面之一是在备份和灾难恢复计划中正确指定 RTO 和 RPO 指标。

确定 RTO 和 RPO 值,实施满足您的业务 SLA 的解决方案,并使您的业务始终可用。