RTO vs. RPO: Warum Wiederherstellungsziele für den IT-Erfolg wichtig sind

Veröffentlicht: 2021-01-25

Unternehmen sind sich bewusst, dass IT-Ausfallzeiten mehr kosten.

Unternehmen müssen die Auswirkungen von Ausfallzeiten berücksichtigen und sich auf die Aufrechterhaltung der Geschäftstätigkeit konzentrieren. Dazu muss ein geeigneter Business-Continuity-Plan implementiert werden, der es ihnen ermöglicht, Ausfallzeiten zu minimieren oder vollständig zu vermeiden. Auf diese Weise können Unternehmen sicherstellen, dass ihre IT-Infrastruktur belastbar ist.

Wenn Sie über geschäftliche Ausfallzeiten sprechen, werden Sie oft von Recovery Time Objectives (RTO) und Recovery Point Objectives (RPO) hören. Es ist für jedes Unternehmen von entscheidender Bedeutung, RTO und RPO vollständig zu verstehen, um eine schnelle Wiederherstellung nach einer Katastrophe sicherzustellen.

Wir werden besprechen, wie RTO und RPO gemessen werden, welche Rolle diese Metriken in einem Backup-Business-Continuity-Plan spielen und wie Sie die RTO- und RPO-Ziele Ihres Unternehmens definieren und erreichen.

Was ist das Wiederherstellungszeitziel (RTO)?

Das Recovery Time Objective (RTO) ist eine wichtige Kennzahl, mit der Sie berechnen können, wie schnell ein System oder eine Anwendung nach einer Ausfallzeit wiederhergestellt werden muss, damit der Geschäftsbetrieb nicht wesentlich beeinträchtigt wird. Kurz gesagt, RTO ist das Maß dafür, wie viel Ausfallzeit Sie tolerieren können.

Im Falle unerwarteter Ausfälle können ein oder zwei Systeme ausfallen und Sie müssen mit Ausfallzeiten rechnen, bis dies behoben ist. Dies bringt Sie in eine Situation, in der Sie die Zeit bestimmen müssen, innerhalb derer Sie das System wiederherstellen müssen, damit Ihr Geschäftsbetrieb nicht unterbrochen wird. Hier kommt RTO ins Spiel.

Das Definieren von RTO beinhaltet das Verständnis der tolerierten Ausfallzeit jedes Systems, und für jede Ihrer Anwendungen werden Sie wahrscheinlich unterschiedliche RTOs haben. Sobald Sie die RTO-Metrik definiert haben, können Sie die Wiederherstellung planen, die eine Wiederherstellungsstrategie und -technologie umfasst, die Sie für eine erfolgreiche und schnelle Wiederherstellung nach Ausfallzeiten benötigen.

Was ist das Recovery Point Objective (RPO)?

Recovery Point Objective (RPO) ist eine Metrik, die Sie für die Menge an Datenverlusten festlegen, die Ihr Unternehmen ertragen und weiterhin ohne Auswirkungen auf den Geschäftsbetrieb funktionieren kann.

Um das RPO zu bestimmen, müssen Sie die Kritikalität der Daten bewerten, um zu wissen, ob Sie alle Daten oder einige davon wiederherstellen müssen, und es kann sogar Daten geben, die relativ weniger wichtig sind und nicht wiederhergestellt werden müssen. Auf dieser Grundlage können Sie RPO für Ihr System definieren: Je höher die Kritikalität von Daten, desto geringer sollte der Wert von RPO sein.

Das Bestimmen von RPO ist ein wesentlicher Bestandteil eines Backup-Plans, da es Ihnen hilft festzulegen, wie oft Sie Ihre Daten basierend auf ihrer Kritikalität sichern möchten.

Unterschiede zwischen RTO und RPO

RTO und RPO sind wichtige Elemente im Zusammenhang mit Backup- und Disaster-Recovery-Plänen. Sowohl RTO als auch RPO werden in Zeiteinheiten definiert und gemessen. Obwohl RTO und RPO gleich klingen mögen, gibt es einige wesentliche Unterschiede:

Wiederherstellungszeitziel (RTO)

Recovery Point Objective (RPO)

Bezogen auf die tolerierbare Ausfallzeit bis zur Wiederherstellung

Bezogen auf tolerierbaren Datenverlust

Bezieht sich auf die Zeit, die für die Wiederherstellung benötigt wird

Bezogen auf die Backup-Frequenz

Bezieht sich auf die Wiederherstellung des Normalzustands mit den neuesten Daten

Bezieht sich darauf, wie aktuell die wiederhergestellten Daten sein werden

Konzentriert sich auf die Wiederherstellungstechnologien, die zum Erreichen der Ziele erforderlich sind, einschließlich der Wiederherstellung des gesamten Systems oder nur der Anwendung oder einer detaillierteren Ebene

Konzentriert sich auf die Automatisierung der Backups für Ihr System in angemessenen Abständen

Verwenden von RTO und RPO zur Minimierung von Geschäftsausfallzeiten

IT-Ausfallzeiten treten aus mehreren Gründen auf, z. B. Systemabstürze, Netzwerk- oder Anwendungsausfälle, Datenverlust aufgrund eines Ransomware-Angriffs oder Standortkatastrophen aufgrund von Naturkatastrophen. Wenn eines der oben genannten unvorhergesehenen Ereignisse eintritt, kann dies Ihren Geschäftsbetrieb stoppen und Sie mehr kosten.

Anwendungen sind entscheidend und müssen immer verfügbar sein. Ein Ausfall einer kritischen Anwendung Ihres Unternehmens führt zu einer Unterbrechung des Anwendungsdienstes und führt auch zu Datenverlust. Dies wirkt sich sowohl kurz- als auch langfristig direkt auf Ihre Geschäftstätigkeit aus und wirkt sich auf Ihre Produktivität, Ihren Umsatz und Ihre Marke aus. In einigen extremen Fällen kann dies sogar dazu führen, dass Ihr Unternehmen den Betrieb aufgibt.

Die tolerierbare Ausfallzeit einer Anwendung kann je nach Unternehmen variieren, aber der entscheidende Faktor ist hier, die Ausfallzeit durch eine schnelle Wiederherstellung der Verfügbarkeit der Anwendung zu reduzieren.

Um Ihre Systeme rechtzeitig zum Laufen zu bringen, muss jedes Unternehmen über eine solide Datenschutzstrategie verfügen, dh über einen Backup- und Disaster-Recovery-Plan. Bei der Auswahl eines Backup- und Disaster-Recovery-Plans für Ihr Unternehmen sollten Sie nach einer Lösung suchen, die eine kürzere RTO und RPO bietet. Dadurch können Sie minimale Ausfallzeiten erzielen und die Geschäftskontinuität sicherstellen, indem Sie das System bei Bedarf wiederherstellen.

Risiken des Ignorierens von RTO- und RPO-Metriken

RTO- und RPO-Metriken helfen Ihnen, die mit Ausfallzeiten verbundenen Risiken zu minimieren, wenn Sie sie richtig einschätzen und definieren. Diese Metriken sollten mit Ihren Geschäftswiederherstellungszielen und der Verwaltung von Service-Level-Agreements (SLAs) abgestimmt werden.

Wenn Sie RTO und RPO nicht richtig definieren, kann dies zu einem Risiko von weniger bis schwerwiegend führen. Außerdem können Sie die Daten nicht zum gewünschten Zeitpunkt wiederherstellen, was zu Datenverlust führen und den Geschäftsbetrieb unterbrechen kann. Darüber hinaus können Sie Ihr System nicht innerhalb der erforderlichen Zeit hochfahren. Wenn das kritische System bei Bedarf nicht verfügbar ist, kann dies den Geschäftsbetrieb zum Erliegen bringen.

In beiden oben genannten Fällen kann eine Unterbrechung des Geschäftsbetriebs zu Produktivitätsverlusten führen. Im schlimmsten Fall führt dies zu Umsatzeinbußen und kann schwerwiegende Folgen wie den Verlust des Rufs des Unternehmens nach sich ziehen.

So erreichen Sie RTO und RPO mit einem Backup- und Disaster-Recovery-Plan

Alle Backup- und Disaster-Recovery-Lösungen, die Sie sich ansehen, geben ihre zugesicherten RPO und RTO in ihrem SLA an. Stellen Sie immer sicher, dass die von Ihnen gewählte Backup- und Disaster-Recovery-Lösung Ihre geschäftlichen Wiederherstellungsziele erfüllt: RTO und RPO.

Backup- und Disaster-Recovery-Lösungen bieten mehrere Funktionen, um Ihre geschäftlichen RTO- und RPO-Ziele zu erreichen. Wir sehen uns einige der wichtigen Funktionen an, auf die Sie bei einer Backup- und Disaster-Recovery-Lösung achten müssen, die Ihrem Unternehmen helfen, RTO und RPO von nahezu null zu erreichen.

Flexible Planungsrichtlinien

Die heutigen Backup- und Disaster-Recovery-Lösungen bieten flexible Planungsrichtlinien, um RPO für Ihre Anwendungen zu definieren. Die Planungsrichtlinien ermöglichen es Ihnen, in regelmäßigen Abständen wie alle paar Minuten, alle paar Stunden oder einmal am Tag eine automatische Sicherung durchzuführen. Dies erleichtert die Implementierung von RPO erheblich.

Continuous Data Protection (CDP) stellt sicher, dass jede Änderung an Ihrem System/Ihrer Anwendung sofort gesichert oder repliziert wird. Dies löst das Problem, bei dem Unternehmen riskieren, Daten zu verlieren, die zwischen zwei geplanten Sicherungen generiert wurden, und ermöglicht es Ihnen, eine RPO von Null zu erreichen. Wenn Sie CDP jedoch für kritische Workloads aktivieren, kann es zu Leistungs- oder Stabilitätsproblemen kommen, da mehr Ressourcen verwendet werden. Aus diesen Gründen wird CDP häufig für Sicherungen auf Dateiebene verwendet.

Fast kontinuierlicher Datenschutz kann auf nahezu Null gesetzt und in regelmäßigen Abständen ausgeführt werden. Dies kommt dem Effekt von CDP nahe und kann aktiviert werden, um eine Sicherung/Replikation auf Image-Ebene durchzuführen, die Snapshot-basierte Technologie oder andere verwendet. Die meisten Backup- und Disaster-Recovery-Lösungen auf dem Markt ermöglichen es Ihnen, für Ihr kritisches System eine RPO von nahezu null von weniger als 15 Minuten zu erreichen.

Sofortige Wiederherstellungsfunktionen

Ihr Unternehmen benötigt eine Option, um Ihre RTO-Ziele nahe Null zu erreichen, die durch sofortige Wiederherstellung erreicht werden können.

Eine der Instant-Recovery-Funktionen, die jedes Unternehmen als Teil seines Backup- und Disaster-Recovery-Plans benötigt, ist die Möglichkeit, die gesicherte Maschine direkt aus dem Backup-Speicher als betriebsbereite virtuelle Maschine zu booten, um ihren Geschäftsbetrieb fortzusetzen.

Sie können eine Maschine in der virtuellen Umgebung sofort vom letzten Backup oder von einem beliebigen Zeitpunkt aus starten, indem Sie die Backup-Daten verwenden, die sich noch im verschlüsselten und komprimierten Format auf Ihrem Backup-Speicher befinden. Sie können Ihr kritisches System jetzt innerhalb weniger Minuten zum Laufen bringen und die Geschäftskontinuität sicherstellen, während Sie eine RTO von nahezu null einhalten.

Auf diese Weise können Sie Ausfallzeiten minimieren und alle Ihre geschäftskritischen Tier-1-Systeme arbeiten ohne Beeinträchtigung des Geschäfts weiter. Später können Sie die sofort gestartete virtuelle Maschine zur dauerhaften Wiederherstellung in die Produktion migrieren.

Granulare Wiederherstellung

Die Rolle der granularen Wiederherstellung in einem Backup- und Disaster-Recovery-Plan spielt eine bedeutende Rolle. Es bietet Ihnen die Möglichkeit, nur die Daten wiederherzustellen, die Sie benötigen.

Mit dieser Option können Sie eine Datei oder ein Anwendungselement direkt aus der Sicherung selektiv wiederherstellen. Wenn Sie versehentlich eine Datei gelöscht haben, können Sie diese bestimmte Datei einfach auswählen und wiederherstellen. Außerdem können Sie eine bestimmte E-Mail oder ein bestimmtes Postfach sofort wiederherstellen, anstatt die gesamte Datenbank oder Anwendung wiederherstellen zu müssen. Jetzt können Sie eine RTO von wenigen Minuten erreichen. Dies spart Zeit und Ressourcen, da nicht jedes Mal eine komplette Maschine wiederhergestellt werden muss, um ein einzelnes Element wiederherzustellen.

Live-Replikation mit Failover

Die Live-Replikation ermöglicht es Ihnen, eine exakte Kopie Ihrer Produktions-Workloads an einem anderen Standort zu erstellen und die Änderungen häufig auf die Replikatmaschine zu replizieren, wobei ein RPO von nahezu null konfiguriert wird.

Wenn Ihre Quellmaschine aufgrund eines Ausfalls oder einer Beschädigung nicht verfügbar ist, können Sie sofort einen Failover-Vorgang durchführen, der den Produktionsbetrieb nahtlos auf Ihre Replikatmaschine umschaltet. Ohne Ausfallzeiten oder Auswirkungen können Sie Ihren Geschäftsbetrieb fortsetzen und gleichzeitig Ihre RTO-Ziele von nahezu null erreichen. In Fällen, in denen sowohl RTO als auch RPO nahe Null sind, können Sie die Replikations- und Failover-Funktionen nutzen und Ihre Produktions-Workloads immer verfügbar halten.

Offsite-Kopie für die Notfallwiederherstellung

Niemand kann eine Katastrophe vorhersagen. Wenn es zu einem Ausfall der gesamten Site kommt, werden sogar Ihre lokalen Backups unzugänglich und Ihr Unternehmen wird gefährdet, ohne dass Ihre Daten wiederhergestellt werden können.

Aus diesem Grund ist es gut, einen Notfallwiederherstellungsplan zu haben, der es Ihnen ermöglicht, eine zusätzliche Kopie Ihres Backups zu erstellen und sie an einem entfernten Ort zu speichern, der entweder ein lokales Rechenzentrum oder eine öffentliche Cloud sein kann. Mit Offsite-Backups können Sie Ihr System im Katastrophenfall wiederherstellen und Ihre geschäftlichen Wiederherstellungsziele problemlos erreichen.

Fazit

Backup- und Disaster-Recovery-Pläne sind ein äußerst wichtiger Teil des Gesamtprozesses zur Bewältigung eines Katastrophenszenarios. Wie oben besprochen, ist einer der Hauptaspekte zur Sicherstellung der Betriebskontinuität im Katastrophenfall die korrekte Angabe der RTO- und RPO-Metriken in Ihrem Backup- und Disaster-Recovery-Plan.

Entscheiden Sie sich für die RTO- und RPO-Werte, implementieren Sie eine Lösung, die Ihre geschäftlichen SLAs erfüllt, und halten Sie Ihr Unternehmen immer verfügbar.