RTO против RPO: почему цели восстановления важны для успеха ИТ

Опубликовано: 2021-01-25

Предприятия осознают, что время простоя ИТ будет стоить дороже.

Компании должны учитывать последствия простоя и сосредоточиться на поддержании непрерывности бизнес-операций. Для этого необходимо реализовать надлежащий план обеспечения непрерывности бизнеса, который позволит минимизировать время простоя или полностью его избежать. Таким образом, компании могут обеспечить устойчивость своей ИТ-инфраструктуры.

Говоря о простоях бизнеса, вы часто будете слышать о целевом времени восстановления (RTO) и целевой точке восстановления (RPO). Для каждого бизнеса крайне важно иметь полное представление о RTO и RPO, чтобы обеспечить быстрое восстановление после аварии.

Мы собираемся обсудить, как измерять RTO и RPO, роль этих показателей в плане обеспечения непрерывности бизнеса резервного копирования, а также как определить и достичь целей RTO и RPO вашего бизнеса.

Что такое целевое время восстановления (RTO)?

Целевое время восстановления (RTO) — это ключевой показатель, который помогает рассчитать, насколько быстро необходимо восстановить систему или приложение после простоя, чтобы это не оказало существенного влияния на бизнес-операции. Короче говоря, RTO — это мера того, сколько времени простоя вы можете допустить.

В случае непредвиденных сбоев одна или две системы могут выйти из строя, и вам придется столкнуться с простоем, пока это не будет решено. Это ставит вас в ситуацию, когда вам нужно определить время, в течение которого вам нужно восстановить систему, чтобы ваши бизнес-операции не прерывались. Здесь на помощь приходит РТО.

Определение RTO включает в себя понимание допустимого времени простоя каждой системы, и для каждого вашего приложения у вас, вероятно, будут разные RTO. После определения метрики RTO вы готовы к планированию восстановления, включающему стратегию восстановления и технологии, необходимые для успешного и быстрого восстановления после простоя.

Что такое целевая точка восстановления (RPO)?

Целевая точка восстановления (RPO) — это метрика, которую вы устанавливаете для определения объема потери данных, которую ваш бизнес может выдержать и продолжать функционировать без какого-либо влияния на бизнес-операции.

Чтобы определить RPO, вам необходимо оценить критичность данных, чтобы узнать, нужно ли восстанавливать все данные или некоторые из них, и даже могут быть данные, которые относительно менее важны и не нуждаются в восстановлении. Исходя из этого, вы сможете определить RPO для вашей системы: чем выше критичность данных, тем меньше должно быть значение RPO.

Определение RPO является важной частью плана резервного копирования, поскольку оно помогает установить частоту резервного копирования данных в зависимости от их критичности.

Различия между RTO и RPO

RTO и RPO являются важными элементами, связанными с планами резервного копирования и аварийного восстановления. И RTO, и RPO определены, а также измерены в единицах времени. Хотя RTO и RPO могут звучать одинаково, между ними есть несколько важных отличий:

Целевое время восстановления (RTO)

Целевая точка восстановления (RPO)

Связано с допустимым временем простоя до восстановления

Связано с допустимой потерей данных

Связано со временем, затраченным на восстановление

Относительно частоты резервного копирования

Связано с восстановлением до нормального состояния с последними данными

Связано с тем, насколько последними будут восстановленные данные

Сосредоточены на технологиях восстановления, необходимых для достижения целей, включая восстановление всей системы или только приложения или более детального уровня.

Сосредоточены на автоматизации резервного копирования вашей системы через определенные промежутки времени.

Использование RTO и RPO для минимизации простоев бизнеса

Простои ИТ происходят по нескольким причинам, таким как системные сбои, сбои сети или приложений, потеря данных из-за атаки программ-вымогателей или сбои на сайте из-за стихийных бедствий. Если произойдет какое-либо из вышеупомянутых непредвиденных обстоятельств, это может остановить ваши бизнес-операции и может стоить вам больше.

Приложения имеют решающее значение и должны быть всегда доступны. Сбой критического приложения вашего бизнеса приводит к прерыванию службы приложения, а также к потере данных. Это оказывает прямое влияние на ваши бизнес-операции как в краткосрочной, так и в долгосрочной перспективе, а также влияет на вашу производительность, доход и бренд. В некоторых крайних случаях это может даже привести к тому, что ваша компания обанкротится.

Допустимое время простоя приложения может варьироваться в зависимости от бизнеса, но критически важным фактором здесь является сокращение времени простоя за счет быстрого восстановления доступности приложения.

Чтобы своевременно настроить и запустить свои системы, каждая компания должна иметь надежную стратегию защиты данных, т. е. план резервного копирования и аварийного восстановления. При выборе плана резервного копирования и аварийного восстановления для вашего бизнеса вам следует искать решение, предлагающее более короткие RTO и RPO. Это позволяет свести к минимуму время простоя и обеспечить непрерывность бизнеса за счет восстановления системы при необходимости.

Риски игнорирования метрик RTO и RPO

Показатели RTO и RPO помогут вам минимизировать риски, связанные с простоем, если вы правильно их оцените и определите. Эти показатели должны быть согласованы с вашими целями восстановления бизнеса и управлением соглашением об уровне обслуживания (SLA).

Если вы не определите RTO и RPO должным образом, это может привести к любому уровню риска, от меньшего до серьезного. Кроме того, вы не сможете восстановить данные с нужного момента времени, что может привести к потере данных и прерыванию бизнес-операций. Кроме того, вы не сможете поднять свою систему в нужное время. Если критическая система недоступна, когда это необходимо, это может привести к остановке бизнес-операций.

В обоих случаях, упомянутых выше, перерыв в бизнес-операциях может привести к потере производительности. В худшем случае это приведет к потере доходов и может привести к серьезным последствиям, например к потере деловой репутации.

Как достичь RTO и RPO с помощью плана резервного копирования и аварийного восстановления

Любые рассматриваемые вами решения для резервного копирования и аварийного восстановления будут указывать гарантированные RPO и RTO в своем SLA. Всегда следите за тем, чтобы выбранное вами решение для резервного копирования и аварийного восстановления соответствовало целям восстановления вашего бизнеса: RTO и RPO.

Решения для резервного копирования и аварийного восстановления предлагают множество функций для достижения целей RTO и RPO вашего бизнеса. Мы рассмотрим некоторые важные функции, которые вам необходимо найти в решении для резервного копирования и аварийного восстановления, которое поможет вашему бизнесу достичь практически нулевого RTO и RPO.

Гибкая политика планирования

Современные решения для резервного копирования и аварийного восстановления предлагают гибкие политики планирования для определения RPO для ваших приложений. Политики планирования позволяют запускать автоматическое резервное копирование через регулярные промежутки времени, например каждые несколько минут, каждые несколько часов или один раз в день. Это значительно упрощает реализацию RPO.

Непрерывная защита данных (CDP) гарантирует, что каждое изменение, вносимое в вашу систему/приложение, мгновенно копируется или реплицируется. Это решает проблему, когда компании рискуют потерять данные, сгенерированные между двумя запланированными резервными копиями, и позволяет достичь нулевой RPO. Однако при включении CDP для критически важных рабочих нагрузок могут возникнуть проблемы с производительностью или стабильностью, поскольку он использует больше ресурсов. По этим причинам CDP широко используется для резервного копирования на уровне файлов.

Почти непрерывная защита данных может быть установлена ​​почти на нуле и запускаться через равные промежутки времени. Это близко к достижению эффекта CDP и может быть включено для выполнения резервного копирования/репликации на уровне образа с использованием технологии на основе моментальных снимков или другой. Большинство решений для резервного копирования и аварийного восстановления, представленных на рынке, позволяют достичь почти нулевой целевой точки восстановления менее чем за 15 минут для критически важной системы.

Возможности мгновенного восстановления

Вашему бизнесу требуется возможность достижения практически нулевых целей RTO, которые могут быть достигнуты за счет мгновенного восстановления.

Одной из возможностей мгновенного восстановления, которая необходима каждому предприятию в рамках плана резервного копирования и аварийного восстановления, является возможность мгновенной загрузки резервной копии машины непосредственно из хранилища резервных копий в качестве готовой виртуальной машины для продолжения своих бизнес-операций.

Вы можете немедленно запустить машину в виртуальной среде из последней резервной копии или из любого момента времени, используя данные резервной копии, которые все еще находятся в зашифрованном и сжатом формате в вашем хранилище резервных копий. Теперь вы можете настроить и запустить критически важную систему за несколько минут и обеспечить непрерывность бизнеса при практически нулевом RTO.

Благодаря этому вы можете свести к минимуму время простоя, а все ваши критически важные системы уровня 1 продолжают работать, не оказывая влияния на бизнес. Позже вы можете перенести мгновенно загруженную виртуальную машину в производственную среду для постоянного восстановления.

Гранулированное восстановление

Роль выборочного восстановления в плане резервного копирования и аварийного восстановления играет значительную роль. Он предоставляет вам возможность восстанавливать только те данные, которые вам нужны.

С помощью этой опции вы можете выборочно восстановить файл или элемент приложения прямо из резервной копии. Если вы случайно удалили файл, вы можете легко выбрать и восстановить этот конкретный файл. Кроме того, вы можете сразу же восстановить определенную почту или почтовый ящик, вместо того чтобы восстанавливать всю базу данных или приложение. Теперь вы сможете достичь RTO в несколько минут. Это экономит время и ресурсы, поскольку нет необходимости каждый раз восстанавливать всю машину для восстановления отдельного элемента.

Живая репликация с аварийным переключением

Репликация в реальном времени позволяет создавать точную копию ваших рабочих нагрузок на другом сайте и часто реплицировать изменения на машину-реплику, настраивая почти нулевую целевую точку восстановления.

Если ваш исходный компьютер становится недоступным из-за какого-либо сбоя или повреждения, вы можете немедленно выполнить операцию аварийного переключения, которая плавно переключает производственные операции на ваш компьютер-реплику. Без каких-либо простоев или последствий вы сможете продолжать свои бизнес-операции, достигая почти нулевых целей RTO. В случаях, когда и RTO, и RPO близки к нулю, вы можете использовать функции репликации и аварийного переключения и поддерживать постоянную доступность рабочих нагрузок.

Внешняя копия для аварийного восстановления

Никто не может предсказать катастрофу. В случае полного сбоя сайта даже ваши локальные резервные копии становятся недоступными и подвергают риску ваш бизнес без возможности восстановления данных.

По этой причине хорошо иметь план аварийного восстановления, позволяющий создать дополнительную копию резервной копии и хранить ее в удаленном месте, которое может быть либо локальным центром обработки данных, либо общедоступным облаком. С помощью удаленного резервного копирования вы можете восстановить свою систему в случае аварии и легко достичь целей восстановления вашего бизнеса.

Вывод

Планы резервного копирования и аварийного восстановления являются чрезвычайно важной частью общего процесса действий в случае аварийного сценария. Как обсуждалось выше, одним из основных аспектов обеспечения непрерывности операций в случае аварии является правильное указание показателей RTO и RPO в вашем плане резервного копирования и аварийного восстановления.

Определите значения RTO и RPO, внедрите решение, соответствующее SLA для вашего бизнеса, и обеспечьте постоянную доступность вашего бизнеса.