RTO e RPO: perché gli obiettivi di ripristino sono importanti per il successo dell'IT

Pubblicato: 2021-01-25

Le aziende sono consapevoli che i tempi di inattività dell'IT costeranno di più.

Le aziende devono considerare le implicazioni dei tempi di fermo e concentrarsi sul mantenimento della continuità delle operazioni aziendali. Per fare ciò, è necessario implementare un piano di continuità aziendale adeguato per consentire loro di ridurre al minimo i tempi di inattività o evitarli completamente. In questo modo, le aziende possono garantire che la loro infrastruttura IT sia resiliente.

Quando si parla di tempi di inattività dell'azienda, si sente spesso parlare di obiettivi del tempo di ripristino (RTO) e obiettivi del punto di ripristino (RPO). È fondamentale per ogni azienda avere una comprensione completa di RTO e RPO per garantire un rapido ripristino da un disastro.

Discuteremo come misurare RTO e RPO, il ruolo di queste metriche in un piano di continuità aziendale di backup e come definire e raggiungere gli obiettivi RTO e RPO della tua azienda.

Che cos'è l'obiettivo del tempo di recupero (RTO)?

L'obiettivo del tempo di ripristino (RTO) è una metrica chiave che consente di calcolare la velocità con cui un sistema o un'applicazione deve essere ripristinato dopo un periodo di inattività, in modo da non avere un impatto significativo sulle operazioni aziendali. In breve, RTO è la misura di quanti tempi di inattività puoi tollerare.

In caso di interruzioni impreviste, uno o due sistemi potrebbero non funzionare e dovrai affrontare tempi di inattività finché il problema non verrà risolto. Questo ti mette in una situazione in cui è necessario determinare il tempo entro il quale è necessario ripristinare il sistema in modo che le operazioni aziendali non si interrompano. È qui che entra in gioco RTO.

La definizione di RTO implica la comprensione dei tempi di inattività della tolleranza di ciascun sistema e per ciascuna delle tue applicazioni, probabilmente avrai diversi RTO. Una volta definita la metrica RTO, sei pronto per pianificare il ripristino che include la strategia e la tecnologia di ripristino di cui hai bisogno per un ripristino rapido e di successo dai tempi di inattività.

Che cos'è l'obiettivo del punto di ripristino (RPO)?

L'obiettivo del punto di ripristino (RPO) è una metrica impostata per la quantità di perdita di dati che la tua azienda può sopportare e continuare a funzionare senza alcun effetto sulle operazioni aziendali.

Per determinare l'RPO, è necessario valutare la criticità dei dati per sapere se è necessario recuperare tutti i dati o alcuni di essi e potrebbero esserci anche dati relativamente meno significativi e che non devono essere ripristinati. Sulla base di ciò, sarai in grado di definire l'RPO per il tuo sistema: maggiore è la criticità dei dati, minore dovrebbe essere il valore di RPO.

La determinazione dell'RPO è una parte essenziale di un piano di backup in quanto ti aiuta a impostare la frequenza con cui desideri eseguire il backup dei dati in base alla loro criticità.

Differenze tra RTO e RPO

RTO e RPO sono elementi importanti associati ai piani di backup e ripristino di emergenza. Sia RTO che RPO sono definiti e misurati in unità di tempo. Sebbene RTO e RPO possano suonare allo stesso modo, ci sono alcune differenze sostanziali:

Obiettivo del tempo di recupero (RTO)

Obiettivo punto di ripristino (RPO)

Relativo al tempo di inattività tollerabile fino al ripristino

Relativo alla perdita di dati tollerabile

Relativo al tempo impiegato per il ripristino

Relativo alla frequenza di backup

Relativo al ripristino della normalità con i dati più recenti

Relativo a quanto saranno più recenti i dati recuperati

Incentrato sulle tecnologie di ripristino necessarie per raggiungere gli obiettivi, incluso il ripristino dell'intero sistema o solo dell'applicazione o di un livello più granulare

Incentrato sull'automazione dei backup per il tuo sistema a intervalli adeguati

Utilizzo di RTO e RPO per ridurre al minimo i tempi di inattività aziendale

I tempi di inattività dell'IT si verificano a causa di molteplici motivi come arresti anomali del sistema, errori della rete o delle applicazioni, perdita di dati a causa di un attacco ransomware o disastri del sito dovuti a calamità naturali. Se si verifica uno degli imprevisti di cui sopra, può interrompere le operazioni aziendali e può costarti di più.

Le applicazioni sono fondamentali e devono essere sempre disponibili. Un errore di un'applicazione critica della tua azienda porta a un'interruzione del servizio dell'applicazione e provoca anche la perdita di dati. Ciò ha un impatto diretto sulle operazioni aziendali sia a breve che a lungo termine e influisce sulla produttività, sui ricavi e sul marchio. In alcuni casi estremi, può persino causare la cessazione dell'attività della tua azienda.

I tempi di inattività della tolleranza di un'applicazione possono variare a seconda dell'azienda, ma il fattore critico in questo caso è ridurre i tempi di inattività ripristinando rapidamente la disponibilità dell'applicazione.

Per far funzionare i sistemi in modo tempestivo, ogni azienda deve disporre di una solida strategia di protezione dei dati, ad esempio un piano di backup e ripristino di emergenza in atto. Quando selezioni un piano di backup e ripristino di emergenza per la tua azienda, dovresti cercare una soluzione che offra un RTO e un RPO più brevi. Ciò consente di ridurre al minimo i tempi di inattività e garantire la continuità aziendale ripristinando il sistema quando richiesto.

Rischi di ignorare le metriche RTO e RPO

Le metriche RTO e RPO ti aiuteranno a ridurre al minimo i rischi associati ai tempi di inattività se li valuti e li definisci correttamente. Queste metriche devono essere allineate con gli obiettivi di ripristino dell'attività e la gestione degli accordi sul livello di servizio (SLA).

Se non si definiscono correttamente RTO e RPO, potrebbe portare a qualsiasi livello di rischio da meno a grave. Inoltre, non sarai in grado di ripristinare i dati dal momento richiesto, il che può comportare la perdita di dati e può interrompere le operazioni aziendali. Inoltre, non sarai in grado di far funzionare il tuo sistema entro il tempo richiesto. Se il sistema critico non è disponibile quando richiesto, ciò può interrompere le operazioni aziendali.

In entrambi i casi sopra menzionati, l'interruzione delle operazioni aziendali può portare a una perdita di produttività. Nei casi peggiori, ciò comporterà una perdita di entrate e può causare gravi implicazioni come la perdita di reputazione aziendale.

Come ottenere RTO e RPO con un piano di backup e ripristino di emergenza

Qualsiasi soluzione di backup e ripristino di emergenza che stai esaminando specificherà il loro RPO e RTO assicurato nel loro SLA. Assicurati sempre che la soluzione di backup e ripristino di emergenza che scegli garantisca i tuoi obiettivi di ripristino aziendale: RTO e RPO.

Le soluzioni di backup e ripristino di emergenza offrono molteplici funzionalità per raggiungere i tuoi obiettivi aziendali RTO e RPO. Esamineremo alcune delle funzionalità importanti che devi cercare in una soluzione di backup e ripristino di emergenza che aiuterà la tua azienda a raggiungere un RTO e un RPO prossimi allo zero.

Politiche di pianificazione flessibili

Le odierne soluzioni di backup e ripristino di emergenza offrono criteri di pianificazione flessibili per definire l'RPO per le tue applicazioni. Le politiche di pianificazione consentono di eseguire un backup automatico a intervalli regolari, ad esempio ogni pochi minuti, ogni poche ore o una volta al giorno. Ciò rende l'implementazione di RPO molto più semplice.

La protezione continua dei dati (CDP) garantisce che ogni volta che viene apportata una modifica al sistema/all'applicazione, ne venga eseguito il backup o la replica istantaneamente. Ciò risolve il problema per cui le aziende rischiano di perdere i dati generati tra due backup pianificati e consente di ottenere un RPO zero. Tuttavia, quando si abilita CDP per carichi di lavoro critici, potrebbero verificarsi problemi di prestazioni o stabilità poiché utilizza più risorse. Per questi motivi, CDP è ampiamente utilizzato per i backup a livello di file.

La protezione dei dati quasi continua può essere impostata quasi a zero ed eseguita a intervalli regolari. Questo è vicino al raggiungimento dell'effetto di CDP e può essere abilitato per l'esecuzione di backup/replica a livello di immagine che utilizza la tecnologia basata su snapshot o altro. La maggior parte delle soluzioni di backup e ripristino di emergenza sul mercato consentono di ottenere un RPO quasi zero in meno di 15 minuti per il sistema critico.

Funzionalità di recupero istantaneo

La tua azienda richiede un'opzione per raggiungere i tuoi obiettivi RTO prossimi allo zero che possono essere raggiunti attraverso il ripristino istantaneo.

Una delle funzionalità di ripristino istantaneo di cui ogni azienda ha bisogno come parte del piano di backup e ripristino di emergenza è la possibilità di avviare istantaneamente la macchina di cui è stato eseguito il backup direttamente dallo storage di backup come macchina virtuale pronta per continuare le operazioni aziendali.

È possibile avviare immediatamente una macchina nell'ambiente virtuale dall'ultimo backup o in qualsiasi momento utilizzando i dati di backup che sono ancora nel formato crittografato e compresso nell'archivio di backup. Ora puoi avere il tuo sistema critico attivo e funzionante in pochi minuti e garantire la continuità aziendale rispettando un RTO vicino allo zero.

In questo modo, puoi ridurre al minimo i tempi di inattività e tutti i tuoi sistemi mission-critical di livello 1 continuano a funzionare senza alcun impatto sul business. Successivamente è possibile migrare la macchina virtuale avviata istantaneamente alla produzione per il ripristino permanente.

Recupero granulare

Il ruolo del ripristino granulare in un piano di backup e ripristino di emergenza gioca un ruolo significativo. Ti offre la possibilità di ripristinare solo i dati di cui hai bisogno.

Con questa opzione è possibile ripristinare selettivamente un file o un elemento dell'applicazione direttamente dal backup. Se hai eliminato accidentalmente un file, puoi facilmente selezionare e ripristinare quel particolare file. Inoltre, è possibile ripristinare immediatamente una posta o una cassetta postale specifica anziché dover ripristinare l'intero database o l'applicazione. Ora sarai in grado di ottenere un RTO di pochi minuti. Ciò consente di risparmiare tempo e risorse poiché non è necessario ripristinare ogni volta un'intera macchina per recuperare un singolo articolo.

Replica in tempo reale con failover

La replica in tempo reale consente di creare una copia esatta dei carichi di lavoro di produzione su un altro sito e di replicare frequentemente le modifiche sulla macchina di replica configurando un RPO prossimo allo zero.

Se il computer di origine non è più disponibile a causa di un'interruzione o di un danneggiamento, è possibile eseguire immediatamente un'operazione di failover che trasferisca senza problemi le operazioni di produzione sul computer di replica. Senza alcun tempo di inattività o impatto, sarai in grado di continuare le tue operazioni aziendali raggiungendo i tuoi obiettivi RTO prossimi allo zero. Nei casi in cui sia l'RTO che l'RPO sono prossimi allo zero, puoi sfruttare le funzionalità di replica e failover e mantenere i carichi di lavoro di produzione sempre disponibili.

Copia fuori sede per il ripristino di emergenza

Nessuno può prevedere un disastro. Se si verifica un errore dell'intero sito, anche i backup locali diventano inaccessibili e mettono a rischio la tua azienda senza essere in grado di recuperare i tuoi dati.

Per questo motivo, è bene disporre di un piano di ripristino di emergenza che consenta di creare una copia aggiuntiva del backup e di archiviarla in una posizione remota che può essere un data center locale o un cloud pubblico. Con i backup fuori sede, puoi ripristinare il tuo sistema in caso di disastro e raggiungere facilmente i tuoi obiettivi di ripristino aziendale.

Conclusione

I piani di backup e ripristino di emergenza sono una parte estremamente importante del processo complessivo di gestione di uno scenario di emergenza. Come discusso in precedenza, uno degli aspetti principali per garantire la continuità delle operazioni in caso di emergenza è specificare correttamente le metriche RTO e RPO nel piano di backup e ripristino di emergenza.

Decidi i valori RTO e RPO, implementa una soluzione che soddisfi i tuoi SLA aziendali e mantieni il tuo business sempre disponibile.