RTO frente a RPO: por qué los objetivos de recuperación son importantes para el éxito de TI
Publicado: 2021-01-25Las empresas son conscientes de que el tiempo de inactividad de TI costará más.
Las empresas deben considerar las implicaciones del tiempo de inactividad y centrarse en mantener la continuidad de las operaciones comerciales. Para hacer esto, se debe implementar un plan de continuidad comercial adecuado que les permita minimizar el tiempo de inactividad o evitarlo por completo. De esta manera, las empresas pueden asegurarse de que su infraestructura de TI sea resistente.
Cuando hable sobre el tiempo de inactividad empresarial, a menudo escuchará acerca de los objetivos de tiempo de recuperación (RTO) y los objetivos de punto de recuperación (RPO). Es fundamental para todas las empresas tener una comprensión completa de RTO y RPO para garantizar una recuperación rápida de un desastre.
Vamos a discutir cómo medir el RTO y el RPO, el papel de estas métricas en un plan de continuidad comercial de respaldo y cómo definir y lograr los objetivos de RTO y RPO de su negocio.
¿Qué es el objetivo de tiempo de recuperación (RTO)?
El objetivo de tiempo de recuperación (RTO) es una métrica clave que lo ayuda a calcular la rapidez con la que se debe recuperar un sistema o una aplicación después del tiempo de inactividad para que no haya un impacto significativo en las operaciones comerciales. En resumen, RTO es la medida de cuánto tiempo de inactividad puede tolerar.
En caso de interrupciones inesperadas, uno o dos sistemas pueden fallar y se enfrentará a un tiempo de inactividad hasta que esto se resuelva. Esto lo coloca en una situación en la que necesita determinar el tiempo dentro del cual necesita restaurar el sistema para que sus operaciones comerciales no se interrumpan. Aquí es donde entra en juego el RTO.
Definir RTO implica comprender la tolerancia del tiempo de inactividad de cada sistema y, para cada una de sus aplicaciones, probablemente tendrá diferentes RTO. Una vez que defina la métrica RTO, estará listo para planificar la recuperación que incluye la estrategia de recuperación y la tecnología que necesita para una restauración rápida y exitosa del tiempo de inactividad.
¿Qué es el objetivo de punto de recuperación (RPO)?
El objetivo de punto de recuperación (RPO) es una métrica que establece para la cantidad de pérdida de datos que su empresa puede soportar y continuar funcionando sin ningún efecto en las operaciones comerciales.
Para determinar el RPO, debe evaluar la criticidad de los datos para saber si necesita recuperar todos los datos o parte de ellos e incluso puede haber datos que son relativamente menos significativos y no necesitan restaurarse. En base a esto, podrá definir RPO para su sistema: cuanto mayor sea la criticidad de los datos, menor debería ser el valor de RPO.
Determinar el RPO es una parte esencial de un plan de copia de seguridad, ya que le ayuda a establecer la frecuencia con la que desea realizar una copia de seguridad de sus datos en función de su criticidad.
Diferencias entre RTO y RPO
RTO y RPO son elementos importantes asociados con los planes de copia de seguridad y recuperación ante desastres. Tanto el RTO como el RPO se definen y miden en unidades de tiempo. Aunque RTO y RPO pueden sonar parecidos, existen algunas diferencias importantes:
Objetivo de tiempo de recuperación (RTO) | Objetivo de punto de recuperación (RPO) |
Relacionado con el tiempo de inactividad tolerable hasta la recuperación | Relacionado con la pérdida de datos tolerable |
Relacionado con el tiempo necesario para restaurar | Relacionado con la frecuencia de respaldo |
Relacionado con la restauración a la normalidad con los datos más recientes | Relacionado con qué tan recientes serán los datos recuperados |
Enfocado en las tecnologías de recuperación requeridas para cumplir con los objetivos, incluida la restauración de todo el sistema o solo la aplicación o un nivel más granular | Centrado en automatizar las copias de seguridad de su sistema a intervalos adecuados |
Uso de RTO y RPO para minimizar el tiempo de inactividad empresarial
El tiempo de inactividad de TI ocurre debido a múltiples razones, como fallas en el sistema, fallas en la red o en la aplicación, pérdida de datos debido a un ataque de ransomware o desastres en el sitio debido a calamidades naturales. Si ocurre alguno de los imprevistos mencionados anteriormente, puede detener sus operaciones comerciales y puede costarle más.
Las aplicaciones son cruciales y deben estar siempre disponibles. Una falla en una aplicación crítica de su negocio genera una interrupción en el servicio de la aplicación y también resulta en la pérdida de datos. Esto tiene un impacto directo en sus operaciones comerciales tanto a corto como a largo plazo y afecta su productividad, ingresos y marca. En algunos casos extremos, incluso puede hacer que su empresa cierre.
El tiempo de inactividad de tolerancia de una aplicación puede variar según el negocio, pero el factor crítico aquí es reducir el tiempo de inactividad al restaurar rápidamente la disponibilidad de la aplicación.
Para que sus sistemas estén en funcionamiento de manera oportuna, todas las empresas deben tener una estrategia sólida de protección de datos, es decir, un plan de copia de seguridad y recuperación ante desastres. Al seleccionar un plan de copia de seguridad y recuperación ante desastres para su negocio, debe buscar una solución que ofrezca un RTO y un RPO más breves. Esto le permite lograr un tiempo de inactividad mínimo y garantizar la continuidad del negocio al restaurar el sistema cuando sea necesario.
Riesgos de ignorar las métricas de RTO y RPO
Las métricas de RTO y RPO lo ayudarán a minimizar los riesgos asociados con el tiempo de inactividad si los evalúa y define correctamente. Estas métricas deben estar alineadas con los objetivos de recuperación de su negocio y la gestión del acuerdo de nivel de servicio (SLA).
Si no define RTO y RPO correctamente, podría conducir a cualquier nivel de riesgo de menor a grave. Además, no podrá restaurar los datos desde el momento requerido, lo que puede provocar la pérdida de datos e interrumpir las operaciones comerciales. Además de eso, no podrá activar su sistema dentro del tiempo requerido. Si el sistema crítico no está disponible cuando se requiere, esto puede detener las operaciones comerciales.
En los dos casos mencionados anteriormente, la interrupción de las operaciones comerciales puede conducir a la pérdida de productividad. En el peor de los casos, esto conducirá a la pérdida de ingresos y puede tener implicaciones graves, como la pérdida de la reputación comercial.

Cómo lograr RTO y RPO con un plan de respaldo y recuperación ante desastres
Cualquier solución de respaldo y recuperación ante desastres que esté buscando especificará su RPO asegurado y RTO asegurado en su SLA. Asegúrese siempre de que la solución de copia de seguridad y recuperación ante desastres que elija garantice los objetivos de recuperación de su negocio: RTO y RPO.
Las soluciones de copia de seguridad y recuperación ante desastres ofrecen múltiples funcionalidades para lograr los objetivos de RTO y RPO de su negocio. Veremos algunas de las funcionalidades importantes que debe buscar en una solución de copia de seguridad y recuperación ante desastres que ayudará a su empresa a lograr un RTO y un RPO cercanos a cero.
Políticas de programación flexibles
Las soluciones de respaldo y recuperación ante desastres de hoy en día ofrecen políticas de programación flexibles para definir el RPO para sus aplicaciones. Las políticas de programación le permiten ejecutar una copia de seguridad automática a intervalos regulares, como cada pocos minutos, cada pocas horas o una vez al día. Esto hace que la implementación de RPO sea mucho más fácil.
La protección continua de datos (CDP) garantiza que cada vez que se realice un cambio en su sistema/aplicación, se realice una copia de seguridad o se replique al instante. Esto resuelve el problema en el que las empresas corren el riesgo de perder datos generados entre dos copias de seguridad programadas y le permite lograr cero RPO. Sin embargo, cuando habilita CDP para cargas de trabajo críticas, puede haber problemas de rendimiento o estabilidad, ya que utiliza más recursos. Por estas razones, CDP se usa ampliamente para copias de seguridad a nivel de archivos.
La protección de datos casi continua se puede establecer en casi cero y ejecutarse a intervalos regulares. Esto está cerca de lograr el efecto de CDP y se puede habilitar para realizar una copia de seguridad/replicación a nivel de imagen que utiliza tecnología basada en instantáneas u otra. La mayoría de las soluciones de copia de seguridad y recuperación ante desastres del mercado le permiten lograr un RPO cercano a cero en menos de 15 minutos para su sistema crítico.
Capacidades de recuperación instantánea
Su negocio requiere una opción para cumplir con sus objetivos de RTO cercano a cero que se pueden lograr a través de la recuperación instantánea.
Una de las capacidades de recuperación instantánea que toda empresa necesita como parte de su plan de respaldo y recuperación ante desastres es la capacidad de iniciar instantáneamente la máquina respaldada directamente desde el almacenamiento de respaldo como una máquina virtual lista para continuar con sus operaciones comerciales.
Puede iniciar inmediatamente una máquina en el entorno virtual desde la última copia de seguridad o desde cualquier momento utilizando los datos de copia de seguridad que todavía están en formato cifrado y comprimido en su almacenamiento de copia de seguridad. Ahora puede tener su sistema crítico en funcionamiento en unos pocos minutos y garantizar la continuidad del negocio mientras cumple con un RTO cercano a cero.
Con esto, puede minimizar el tiempo de inactividad y todos sus sistemas de misión crítica de nivel 1 continúan funcionando sin impacto en el negocio. Más tarde, puede migrar la máquina virtual iniciada instantáneamente a producción para una recuperación permanente.
Recuperación granular
El papel de la recuperación granular en un plan de copia de seguridad y recuperación ante desastres juega un papel importante. Le brinda la capacidad de restaurar solo los datos que necesita.
Con esta opción, puede restaurar de forma selectiva un archivo o un elemento de la aplicación directamente desde la copia de seguridad. Si ha eliminado un archivo por accidente, puede seleccionar y restaurar fácilmente ese archivo en particular. Además, puede restaurar inmediatamente un correo o buzón específico en lugar de tener que recuperar toda la base de datos o la aplicación. Ahora, podrá lograr un RTO de unos pocos minutos. Esto ahorra tiempo y recursos, ya que no es necesario restaurar una máquina completa cada vez que se recupera un elemento individual.
Replicación en vivo con conmutación por error
La replicación en vivo le permite crear una copia exacta de sus cargas de trabajo de producción en otro sitio y replicar con frecuencia los cambios en la máquina de réplica configurando un RPO cercano a cero.
Si su máquina de origen deja de estar disponible debido a una interrupción o corrupción, puede realizar inmediatamente una operación de conmutación por error que cambia sin problemas las operaciones de producción a su máquina réplica. Sin tiempo de inactividad ni impacto, podrá continuar sus operaciones comerciales mientras cumple con sus objetivos de RTO de casi cero. En los casos en que tanto el RTO como el RPO estén cerca de cero, puede aprovechar las funcionalidades de replicación y conmutación por error y mantener sus cargas de trabajo de producción siempre disponibles.
Copia externa para recuperación ante desastres
Nadie puede predecir un desastre. Si hay una falla en todo el sitio, incluso sus copias de seguridad locales se vuelven inaccesibles y ponen en riesgo su negocio sin poder recuperar sus datos.
Por esta razón, es bueno tener un plan de recuperación ante desastres que le permita crear una copia adicional de su copia de seguridad y almacenarla en una ubicación remota que puede ser un centro de datos local o una nube pública. Con las copias de seguridad externas, puede recuperar su sistema en caso de desastre y cumplir fácilmente con los objetivos de recuperación de su negocio.
Conclusión
Los planes de respaldo y recuperación ante desastres son una parte extremadamente importante del proceso general de manejo de un escenario de desastre. Como se discutió anteriormente, uno de los aspectos principales para garantizar la continuidad de las operaciones en caso de un desastre es especificar correctamente las métricas de RTO y RPO en su plan de copia de seguridad y recuperación ante desastres.
Decida los valores de RTO y RPO, implemente una solución que cumpla con los SLA de su negocio y mantenga su negocio siempre disponible.