RTO vs. RPO: Dlaczego cele odzyskiwania są ważne dla sukcesu IT

Opublikowany: 2021-01-25

Firmy są świadome, że przestoje IT będą kosztować więcej.

Firmy muszą brać pod uwagę konsekwencje przestojów i skupić się na utrzymaniu ciągłości operacji biznesowych. Aby to zrobić, należy wdrożyć odpowiedni plan ciągłości działania, aby umożliwić zminimalizowanie przestojów lub ich całkowite uniknięcie. W ten sposób firmy mogą zapewnić odporność swojej infrastruktury IT.

Omawiając przestoje biznesowe, często słyszysz o celach czasu odzyskiwania (RTO) i celach punktu odzyskiwania (RPO). Dla każdej firmy kluczowe znaczenie ma pełne zrozumienie RTO i RPO, aby zapewnić szybkie odzyskiwanie danych po awarii.

Omówimy, jak mierzyć RTO i RPO, rolę tych wskaźników w zapasowym planie ciągłości biznesowej oraz jak zdefiniować i osiągnąć cele RTO i RPO firmy.

Co to jest docelowy czas odzyskiwania (RTO)?

Docelowy czas odzyskiwania (RTO) to kluczowa metryka, która pomaga obliczyć, jak szybko system lub aplikacja musi zostać przywrócona po przestoju, aby nie miało znaczącego wpływu na operacje biznesowe. Krótko mówiąc, RTO jest miarą tego, ile przestojów możesz tolerować.

W przypadku nieoczekiwanych awarii jeden lub dwa systemy mogą ulec awarii i będziesz musiał stawić czoła przestojowi, dopóki problem nie zostanie rozwiązany. To stawia Cię w sytuacji, w której musisz określić czas, w którym musisz przywrócić system, aby Twoja działalność biznesowa nie została przerwana. Tu właśnie wkracza RTO.

Definiowanie RTO obejmuje zrozumienie czasu przestoju tolerancji każdego systemu i dla każdej aplikacji prawdopodobnie będziesz mieć różne RTO. Po zdefiniowaniu metryki RTO wszystko jest gotowe do zaplanowania odzyskiwania, które obejmuje strategię odzyskiwania i technologię potrzebną do pomyślnego i szybkiego przywrócenia z przestoju.

Co to jest cel punktu odzyskiwania (RPO)?

Cel punktu odzyskiwania (RPO) to metryka, którą ustawiasz dla ilości utraconych danych, które Twoja firma może znieść i nadal działać bez żadnego wpływu na operacje biznesowe.

Aby określić RPO, musisz ocenić krytyczność danych, aby wiedzieć, czy musisz odzyskać wszystkie dane, czy niektóre z nich, a nawet mogą istnieć dane, które są stosunkowo mniej istotne i nie wymagają przywracania. Na tej podstawie będziesz mógł zdefiniować RPO dla swojego systemu: im wyższa krytyczność danych, tym mniejsza powinna być wartość RPO.

Określenie RPO jest istotną częścią planu tworzenia kopii zapasowych, ponieważ pomaga ustawić częstotliwość tworzenia kopii zapasowych danych w oparciu o ich krytyczność.

Różnice między RTO a RPO

RTO i RPO to ważne elementy związane z planami tworzenia kopii zapasowych i odzyskiwania po awarii. Zarówno RTO, jak i RPO są zdefiniowane i mierzone w jednostkach czasu. Chociaż RTO i RPO mogą brzmieć podobnie, istnieją pewne główne różnice:

Docelowy czas odzyskiwania (RTO)

Cel punktu odzyskiwania (RPO)

Związane z tolerowanym czasem przestoju do czasu wyzdrowienia

Związane z tolerowaną utratą danych

Związane z czasem potrzebnym na przywrócenie

Związane z częstotliwością tworzenia kopii zapasowych

Związane z przywracaniem do normalnego stanu z najnowszymi danymi

Związane z tym, jak najpóźniej będą odzyskane dane

Koncentruje się na technologiach odzyskiwania wymaganych do osiągnięcia celów, w tym przywracaniu całego systemu lub tylko aplikacji lub na bardziej szczegółowym poziomie

Koncentruje się na automatyzacji tworzenia kopii zapasowych Twojego systemu w odpowiednich odstępach czasu

Korzystanie z RTO i RPO w celu zminimalizowania przestojów w firmie

Przestój IT występuje z wielu powodów, takich jak awarie systemu, awarie sieci lub aplikacji, utrata danych w wyniku ataku ransomware lub awarie witryn spowodowane klęskami żywiołowymi. Jeśli zdarzy się którakolwiek z wyżej wymienionych nieprzewidzianych sytuacji, może to zatrzymać Twoją działalność biznesową i może kosztować Cię więcej.

Aplikacje mają kluczowe znaczenie i muszą być zawsze dostępne. Awaria krytycznej aplikacji Twojej firmy prowadzi do przerwy w działaniu usługi aplikacji, a także powoduje utratę danych. Ma to bezpośredni wpływ na operacje biznesowe zarówno w perspektywie krótko-, jak i długoterminowej oraz wpływa na wydajność, przychody i markę. W niektórych skrajnych przypadkach może to nawet spowodować, że Twoja firma zbankrutuje.

Tolerancja przestojów aplikacji może się różnić w zależności od firmy, ale kluczowym czynnikiem jest tutaj skrócenie przestojów poprzez szybkie przywrócenie dostępności aplikacji.

Aby zapewnić szybkie uruchomienie i uruchomienie systemów, każda firma musi mieć solidną strategię ochrony danych, tj. plan tworzenia kopii zapasowych i odzyskiwania po awarii. Wybierając plan tworzenia kopii zapasowych i odzyskiwania po awarii dla swojej firmy, powinieneś poszukać rozwiązania, które oferuje krótsze RTO i RPO. Pozwala to na skrócenie czasu przestojów i zapewnienie ciągłości biznesowej poprzez przywrócenie systemu w razie potrzeby.

Ryzyko ignorowania wskaźników RTO i RPO

Wskaźniki RTO i RPO pomogą zminimalizować ryzyko związane z przestojami, jeśli odpowiednio je ocenisz i zdefiniujesz. Te metryki powinny być dostosowane do celów odzyskiwania firmy i zarządzania umową dotyczącą poziomu usług (SLA).

Jeśli nie zdefiniujesz prawidłowo RTO i RPO, może to prowadzić do dowolnego poziomu ryzyka, od mniejszego do poważnego. Ponadto nie będzie można przywrócić danych z wymaganego punktu w czasie, co może skutkować utratą danych i przerwaniem działalności biznesowej. Co więcej, nie będziesz w stanie uruchomić systemu w wymaganym czasie. Jeśli krytyczny system jest niedostępny, gdy jest to wymagane, może to zatrzymać operacje biznesowe.

W obu wymienionych powyżej przypadkach przerwa w działalności biznesowej może prowadzić do utraty produktywności. W najgorszych przypadkach doprowadzi to do utraty przychodów i może spowodować poważne konsekwencje, takie jak utrata reputacji biznesowej.

Jak osiągnąć RTO i RPO dzięki planowi tworzenia kopii zapasowych i odzyskiwania po awarii?

Wszelkie rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii, na które patrzysz, określą gwarantowane RPO i RTO w umowie SLA. Zawsze upewnij się, że wybrane rozwiązanie do tworzenia kopii zapasowych i odzyskiwania po awarii zapewnia osiągnięcie celów związanych z odzyskiwaniem danych biznesowych: RTO i RPO.

Rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii oferują wiele funkcji umożliwiających osiągnięcie celów biznesowych RTO i RPO. Przyjrzymy się niektórym ważnym funkcjom, których należy szukać w rozwiązaniu do tworzenia kopii zapasowych i odzyskiwania po awarii, które pomoże Twojej firmie osiągnąć RTO i RPO bliskie zeru.

Elastyczne zasady planowania

Dzisiejsze rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii oferują elastyczne zasady planowania w celu zdefiniowania RPO dla aplikacji. Zasady planowania umożliwiają uruchamianie automatycznej kopii zapasowej w regularnych odstępach czasu, na przykład co kilka minut, co kilka godzin lub raz dziennie. To znacznie ułatwia wdrożenie RPO.

Ciągła ochrona danych (CDP) zapewnia, że ​​za każdym razem, gdy w systemie/aplikacji zostanie wprowadzona zmiana, zostanie ona natychmiast utworzona lub zreplikowana. Rozwiązuje to problem, w którym firmy ryzykują utratę danych wygenerowanych między dwoma zaplanowanymi kopiami zapasowymi i pozwala osiągnąć zerowy RPO. Jednak po włączeniu protokołu CDP dla krytycznych obciążeń mogą wystąpić problemy z wydajnością lub stabilnością, ponieważ wykorzystuje on więcej zasobów. Z tych powodów protokół CDP jest szeroko stosowany do tworzenia kopii zapasowych na poziomie plików.

Prawie ciągłą ochronę danych można ustawić na wartość bliską zeru i uruchamiać w regularnych odstępach czasu. Jest to bliskie osiągnięcia efektu CDP i można je włączyć do wykonywania kopii zapasowych/replikacji na poziomie obrazu przy użyciu technologii opartej na migawkach lub innej. Większość dostępnych na rynku rozwiązań do tworzenia kopii zapasowych i odzyskiwania danych po awarii pozwala osiągnąć niemal zerowe RPO w czasie poniżej 15 minut dla krytycznego systemu.

Możliwości natychmiastowego odzyskiwania

Twoja firma wymaga możliwości osiągnięcia niemal zerowych celów RTO, które można osiągnąć dzięki natychmiastowemu odzyskiwaniu.

Jedną z funkcji natychmiastowego odzyskiwania, których każda firma potrzebuje w ramach planu tworzenia kopii zapasowych i odzyskiwania po awarii, jest możliwość natychmiastowego uruchomienia maszyny, na której utworzono kopię zapasową, bezpośrednio z magazynu kopii zapasowych jako maszyny wirtualnej w stanie gotowości w celu kontynuowania działalności biznesowej.

Maszynę w środowisku wirtualnym można natychmiast uruchomić z najnowszej kopii zapasowej lub z dowolnego punktu w czasie, korzystając z danych kopii zapasowej, które nadal znajdują się w zaszyfrowanym i skompresowanym formacie w magazynie kopii zapasowych. Możesz teraz uruchomić i uruchomić swój krytyczny system w ciągu kilku minut i zapewnić ciągłość biznesową, jednocześnie osiągając niemal zerowe RTO.

Dzięki temu możesz zminimalizować przestoje, a wszystkie krytyczne systemy warstwy 1 nadal działają bez wpływu na biznes. Później można przenieść natychmiast uruchomioną maszynę wirtualną do środowiska produkcyjnego w celu trwałego odzyskania.

Odzyskiwanie granulek

Rola odzyskiwania granularnego w planie tworzenia kopii zapasowych i odzyskiwania po awarii odgrywa znaczącą rolę. Zapewnia możliwość przywrócenia tylko potrzebnych danych.

Dzięki tej opcji można selektywnie przywrócić plik lub element aplikacji bezpośrednio z kopii zapasowej. Jeśli przypadkowo usunąłeś plik, możesz łatwo wybrać i przywrócić ten konkretny plik. Ponadto można natychmiast przywrócić konkretną pocztę lub skrzynkę pocztową bez konieczności odzyskiwania całej bazy danych lub aplikacji. Teraz będziesz w stanie osiągnąć RTO na poziomie kilku minut. Oszczędza to czas i zasoby, ponieważ nie jest konieczne przywracanie całej maszyny za każdym razem w celu odzyskania pojedynczego elementu.

Replikacja na żywo z przełączaniem awaryjnym

Replikacja na żywo pozwala tworzyć dokładną kopię obciążeń produkcyjnych w innej lokalizacji i często replikować zmiany na maszynie repliki, konfigurując RPO bliskie zeru.

Jeśli twoja maszyna źródłowa stanie się niedostępna z powodu awarii lub uszkodzenia, możesz natychmiast wykonać operację przełączania awaryjnego, która bezproblemowo przełączy operacje produkcyjne na twoją replikę. Bez przestojów lub wpływu, będziesz mógł kontynuować swoją działalność biznesową, osiągając niemal zerowe cele RTO. W przypadkach, gdy zarówno RTO, jak i RPO są bliskie zeru, można wykorzystać funkcje replikacji i przełączania awaryjnego, aby zawsze mieć dostęp do obciążeń produkcyjnych.

Kopia poza siedzibą firmy do odzyskiwania po awarii

Nikt nie jest w stanie przewidzieć katastrofy. W przypadku awarii całej witryny nawet lokalne kopie zapasowe stają się niedostępne i narażają firmę na ryzyko bez możliwości odzyskania danych.

Z tego powodu dobrze jest mieć plan odzyskiwania po awarii, który umożliwia utworzenie dodatkowej kopii kopii zapasowej i przechowywanie jej w zdalnej lokalizacji, którą może być lokalne centrum danych lub chmura publiczna. Kopie zapasowe poza siedzibą firmy umożliwiają odzyskanie systemu w przypadku awarii i łatwe osiągnięcie celów związanych z odzyskiwaniem danych biznesowych.

Wniosek

Plany tworzenia kopii zapasowych i odzyskiwania po awarii są niezwykle ważną częścią całego procesu radzenia sobie ze scenariuszem awarii. Jak omówiono powyżej, jednym z podstawowych aspektów zapewnienia ciągłości działania w przypadku awarii jest prawidłowe określenie metryk RTO i RPO w planie tworzenia kopii zapasowych i odzyskiwania po awarii.

Zdecyduj o wartościach RTO i RPO, zaimplementuj rozwiązanie, które spełnia Twoje biznesowe umowy SLA i utrzymuj swoją firmę zawsze dostępną.