RTO vs. RPO: Mengapa Tujuan Pemulihan Penting untuk Keberhasilan TI
Diterbitkan: 2021-01-25Bisnis menyadari bahwa downtime TI akan lebih mahal.
Perusahaan harus mempertimbangkan implikasi dari downtime dan fokus untuk menjaga kelangsungan operasi bisnis. Untuk melakukan ini, rencana kesinambungan bisnis yang tepat perlu diterapkan untuk memungkinkan mereka meminimalkan waktu henti atau menghindarinya sama sekali. Dengan cara ini, perusahaan dapat memastikan bahwa infrastruktur TI mereka tangguh.
Saat membahas waktu henti bisnis, Anda akan sering mendengar tentang tujuan waktu pemulihan (RTO) dan tujuan titik pemulihan (RPO). Sangat penting bagi setiap bisnis untuk memiliki pemahaman yang lengkap tentang RTO dan RPO untuk memastikan pemulihan yang cepat dari bencana.
Kita akan membahas cara mengukur RTO dan RPO, peran metrik ini dalam rencana kelangsungan bisnis cadangan, dan cara menentukan dan mencapai sasaran RTO dan RPO bisnis Anda.
Apa tujuan waktu pemulihan (RTO)?
Tujuan waktu pemulihan (RTO) adalah metrik utama yang membantu Anda menghitung seberapa cepat sistem atau aplikasi perlu dipulihkan setelah waktu henti sehingga tidak ada dampak signifikan pada operasi bisnis. Singkatnya, RTO adalah ukuran seberapa banyak waktu henti yang dapat Anda toleransi.
Jika terjadi pemadaman tak terduga, satu atau dua sistem mungkin gagal dan Anda akan menghadapi waktu henti hingga masalah ini teratasi. Ini menempatkan Anda dalam situasi di mana Anda perlu menentukan waktu di mana Anda perlu memulihkan sistem sehingga operasi bisnis Anda tidak terganggu. Di sinilah RTO masuk.
Mendefinisikan RTO melibatkan pemahaman toleransi downtime dari setiap sistem dan untuk setiap aplikasi Anda, Anda mungkin akan memiliki RTO yang berbeda. Setelah Anda menentukan metrik RTO, Anda siap untuk merencanakan pemulihan yang mencakup strategi dan teknologi pemulihan yang perlu Anda miliki untuk pemulihan yang sukses dan cepat dari waktu henti.
Apa tujuan titik pemulihan (RPO)?
Tujuan titik pemulihan (RPO) adalah metrik yang Anda tetapkan untuk jumlah kehilangan data yang dapat ditanggung bisnis Anda dan terus berfungsi tanpa pengaruh apa pun pada operasi bisnis.
Untuk menentukan RPO, Anda perlu menilai kekritisan data untuk mengetahui apakah Anda perlu memulihkan semua data atau sebagian dan bahkan mungkin ada data yang relatif kurang signifikan dan tidak perlu dipulihkan. Berdasarkan ini, Anda akan dapat menentukan RPO untuk sistem Anda: semakin tinggi kekritisan data, semakin kecil nilai RPO.
Menentukan RPO adalah bagian penting dari rencana pencadangan karena membantu Anda mengatur seberapa sering Anda ingin mencadangkan data berdasarkan tingkat kekritisannya.
Perbedaan antara RTO dan RPO
RTO dan RPO adalah elemen penting yang terkait dengan rencana pencadangan dan pemulihan bencana. Baik RTO dan RPO didefinisikan serta diukur dalam satuan waktu. Meskipun RTO dan RPO mungkin terdengar sama, ada beberapa perbedaan utama:
Tujuan waktu pemulihan (RTO) | Tujuan titik pemulihan (RPO) |
Terkait dengan waktu henti yang dapat ditoleransi hingga pemulihan | Terkait dengan kehilangan data yang dapat ditoleransi |
Terkait dengan waktu yang dibutuhkan untuk memulihkan | Terkait dengan frekuensi cadangan |
Terkait mengembalikan ke normal dengan data terbaru | Terkait dengan seberapa terbaru data yang dipulihkan |
Berfokus pada teknologi pemulihan yang diperlukan untuk memenuhi tujuan, termasuk memulihkan seluruh sistem atau hanya aplikasi atau tingkat yang lebih terperinci | Berfokus pada mengotomatiskan pencadangan untuk sistem Anda pada interval yang tepat |
Menggunakan RTO dan RPO untuk meminimalkan waktu henti bisnis
Waktu henti TI terjadi karena berbagai alasan seperti sistem mogok, kegagalan jaringan atau aplikasi, kehilangan data karena serangan ransomware, atau bencana situs karena bencana alam. Jika salah satu hal yang tidak terduga tersebut terjadi, itu dapat menghentikan operasi bisnis Anda dan dapat membebani Anda lebih banyak.
Aplikasi sangat penting dan harus selalu tersedia. Kegagalan aplikasi penting bisnis Anda menyebabkan gangguan dalam layanan aplikasi dan juga mengakibatkan hilangnya data. Ini berdampak langsung pada operasi bisnis Anda baik dalam jangka pendek maupun jangka panjang dan memengaruhi produktivitas, pendapatan, dan merek Anda. Dalam beberapa kasus ekstrim, bahkan dapat menyebabkan perusahaan Anda gulung tikar.
Waktu henti toleransi aplikasi dapat bervariasi tergantung pada bisnis, tetapi faktor penting di sini adalah mengurangi waktu henti dengan memulihkan ketersediaan aplikasi dengan cepat.
Agar sistem Anda aktif dan berjalan tepat waktu, setiap bisnis perlu memiliki strategi perlindungan data yang solid, yaitu rencana pencadangan dan pemulihan bencana. Saat memilih rencana pencadangan dan pemulihan bencana untuk bisnis Anda, Anda harus mencari solusi yang menawarkan RTO dan RPO yang lebih pendek. Ini memungkinkan Anda mencapai waktu henti minimal dan memastikan kelangsungan bisnis dengan memulihkan sistem saat diperlukan.
Risiko mengabaikan metrik RTO dan RPO
Metrik RTO dan RPO akan membantu Anda meminimalkan risiko yang terkait dengan waktu henti jika Anda menilai dan mendefinisikannya dengan benar. Metrik ini harus selaras dengan tujuan pemulihan bisnis dan manajemen perjanjian tingkat layanan (SLA) Anda.
Jika Anda tidak mendefinisikan RTO dan RPO dengan benar, hal itu dapat menyebabkan tingkat risiko apa pun mulai dari yang kurang hingga yang parah. Selain itu, Anda tidak akan dapat memulihkan data dari titik waktu yang diperlukan, yang dapat mengakibatkan hilangnya data dan dapat mengganggu operasi bisnis. Selain itu, Anda tidak akan dapat mengaktifkan sistem Anda dalam waktu yang diperlukan. Jika sistem kritis tidak tersedia saat diperlukan, ini dapat menghentikan operasi bisnis.

Dalam kedua kasus yang disebutkan di atas, gangguan dalam operasi bisnis dapat menyebabkan hilangnya produktivitas. Dalam kasus terburuk, ini akan menyebabkan hilangnya pendapatan dan dapat menyebabkan implikasi serius seperti hilangnya reputasi bisnis.
Cara mencapai RTO dan RPO dengan cadangan dan rencana pemulihan bencana
Solusi pencadangan dan pemulihan bencana apa pun yang Anda cari akan menentukan RPO dan RTO yang terjamin dalam SLA mereka. Selalu pastikan bahwa solusi pencadangan dan pemulihan bencana yang Anda pilih memastikan sasaran tujuan pemulihan bisnis Anda: RTO dan RPO.
Solusi pencadangan dan pemulihan bencana menawarkan banyak fungsi untuk mencapai tujuan RTO dan RPO bisnis Anda. Kami akan melihat beberapa fungsi penting yang perlu Anda cari dalam solusi pencadangan dan pemulihan bencana yang akan membantu bisnis Anda mencapai RTO dan RPO mendekati nol.
Kebijakan penjadwalan yang fleksibel
Solusi pencadangan dan pemulihan bencana hari ini menawarkan kebijakan penjadwalan yang fleksibel untuk menentukan RPO untuk aplikasi Anda. Kebijakan penjadwalan memungkinkan Anda menjalankan pencadangan otomatis secara berkala seperti setiap beberapa menit, setiap beberapa jam, atau sekali sehari. Hal ini membuat implementasi RPO menjadi lebih mudah.
Perlindungan data berkelanjutan (CDP) memastikan bahwa setiap kali perubahan dibuat pada sistem/aplikasi Anda, itu dicadangkan atau direplikasi secara instan. Ini memecahkan masalah di mana bisnis berisiko kehilangan data yang dihasilkan antara dua pencadangan terjadwal dan memungkinkan Anda mencapai nol RPO. Namun, saat Anda mengaktifkan CDP untuk beban kerja kritis, mungkin ada masalah kinerja atau stabilitas karena menggunakan lebih banyak sumber daya. Untuk alasan ini, CDP banyak digunakan untuk pencadangan tingkat file.
Perlindungan data hampir berkelanjutan dapat diatur ke mendekati nol dan dijalankan secara berkala. Ini hampir mencapai efek CDP dan dapat diaktifkan untuk melakukan pencadangan/replikasi tingkat gambar yang menggunakan teknologi berbasis snapshot atau lainnya. Sebagian besar solusi pencadangan dan pemulihan bencana di pasar memungkinkan Anda mencapai RPO mendekati nol dalam waktu kurang dari 15 menit untuk sistem kritis Anda.
Kemampuan pemulihan instan
Bisnis Anda memerlukan opsi untuk memenuhi sasaran RTO mendekati nol yang dapat dicapai melalui pemulihan instan.
Salah satu kemampuan pemulihan instan yang dibutuhkan setiap bisnis sebagai bagian dari rencana pencadangan dan pemulihan bencana mereka adalah kemampuan untuk langsung mem-boot mesin yang dicadangkan langsung dari penyimpanan cadangan sebagai mesin virtual siap pakai untuk melanjutkan operasi bisnis mereka.
Anda dapat segera memulai mesin di lingkungan virtual dari cadangan terbaru atau dari titik waktu mana pun menggunakan data cadangan yang masih dalam format terenkripsi dan terkompresi pada penyimpanan cadangan Anda. Sekarang Anda dapat mengaktifkan dan menjalankan sistem penting Anda dalam beberapa menit dan memastikan kelangsungan bisnis sambil memenuhi RTO yang mendekati nol.
Dengan ini, Anda dapat meminimalkan waktu henti dan semua sistem kritis misi Tingkat 1 Anda terus beroperasi tanpa berdampak pada bisnis. Kemudian Anda dapat memigrasikan mesin virtual yang langsung di-boot ke produksi untuk pemulihan permanen.
Pemulihan granular
Peran pemulihan granular dalam rencana cadangan dan pemulihan bencana memainkan peran penting. Ini memberi Anda kemampuan untuk memulihkan hanya data yang Anda butuhkan.
Dengan opsi ini, Anda dapat secara selektif memulihkan file atau item aplikasi langsung dari cadangan. Jika Anda tidak sengaja menghapus file, Anda dapat dengan mudah memilih dan memulihkan file tersebut. Selain itu, Anda dapat segera memulihkan surat atau kotak surat tertentu daripada harus memulihkan seluruh database atau aplikasi. Sekarang, Anda akan dapat mencapai RTO beberapa menit. Ini menghemat waktu dan sumber daya karena tidak perlu memulihkan seluruh mesin setiap kali untuk memulihkan satu item.
Replikasi langsung dengan failover
Replikasi langsung memungkinkan Anda membuat salinan persis beban kerja produksi di situs lain dan sering mereplikasi perubahan pada mesin replika yang mengonfigurasi RPO mendekati nol.
Jika mesin sumber Anda menjadi tidak tersedia karena pemadaman atau kerusakan apa pun, Anda dapat segera melakukan operasi failover yang secara mulus mengalihkan operasi produksi ke mesin replika Anda. Tanpa downtime atau dampak apa pun, Anda akan dapat melanjutkan operasi bisnis sambil memenuhi sasaran RTO yang mendekati nol. Jika RTO dan RPO mendekati nol, Anda dapat memanfaatkan fungsi replikasi dan failover serta menjaga agar beban kerja produksi Anda selalu tersedia.
Salinan di luar lokasi untuk pemulihan bencana
Tidak ada yang bisa memprediksi bencana. Jika ada kegagalan situs penuh, bahkan cadangan lokal Anda menjadi tidak dapat diakses dan membahayakan bisnis Anda tanpa dapat memulihkan data Anda.
Untuk alasan ini, ada baiknya memiliki rencana pemulihan bencana yang memungkinkan Anda membuat salinan cadangan tambahan dan menyimpannya di lokasi terpencil yang dapat berupa pusat data lokal atau cloud publik. Dengan pencadangan di luar lokasi, Anda dapat memulihkan sistem jika terjadi bencana dan memenuhi tujuan pemulihan bisnis Anda dengan mudah.
Kesimpulan
Rencana pencadangan dan pemulihan bencana adalah bagian yang sangat penting dari keseluruhan proses penanganan skenario bencana. Seperti dibahas di atas, salah satu aspek utama untuk memastikan kelangsungan operasi jika terjadi bencana adalah menentukan metrik RTO dan RPO dengan benar dalam rencana pencadangan dan pemulihan bencana Anda.
Tentukan nilai RTO dan RPO, terapkan solusi yang memenuhi SLA bisnis Anda, dan jaga agar bisnis Anda selalu tersedia.