Memahami Terminologi Pemulihan Bencana – RTO, RPO, Failover, BCP, dan lainnya
Diterbitkan: 2022-03-20Rencana pemulihan bencana adalah ukuran terpenting yang harus dimiliki organisasi sebelum peristiwa yang tidak biasa menimpa mereka.
Di industri TI, dimulai dengan membuat dokumen formal yang berisi rencana, tindakan, dan prosedur untuk menangani bencana dan efek sampingnya.
Bencana adalah suatu kejadian yang datang secara tiba-tiba tanpa pemberitahuan sebelumnya dan dapat bermacam-macam jenisnya. Dan ketika mendarat, individu dan organisasi menghadapi berbagai macam kesulitan, termasuk masalah keuangan dan pengalaman pengguna.
Jika serangan terjadi, Anda harus siap untuk meminimalkan efeknya dan memulihkan operasi Anda lebih cepat. Di sinilah mempersiapkan rencana pemulihan bencana praktis akan membantu Anda menahan atau mencegah bencana. Anda juga dapat mengurangi efek sampingnya dalam hal pengalaman pengguna, biaya, dan waktu henti.
Selain itu, Anda harus menjaga agar rencana, orang, strategi, peralatan, dan sistem Anda siap untuk menjalankan semuanya kembali. Tetapi untuk ini, Anda harus memahami pemulihan bencana secara mendalam.
Dalam artikel ini, saya akan membahasnya secara rinci bersama dengan istilah kunci pemulihan bencana sehingga Anda dapat melawan dengan berani dan menjadi lebih kuat dalam kondisi buruk seperti itu.
Mari kita mulai!
Apa Itu Bencana?

Bencana adalah peristiwa tak terduga yang dapat terjadi di mana saja, termasuk industri TI. Itu terjadi baik secara alami atau oleh orang-orang dan dapat mengganggu operasi perusahaan dan mengganggu struktur infrastruktur.
Akibatnya, organisasi dan pelanggan, vendor, karyawan, dan mitranya terpengaruh. Ini memberi tekanan pada organisasi dalam hal keuangan, reputasi industri, kepercayaan pelanggan, dan batas keamanan.
Oleh karena itu, Anda harus siap terlebih dahulu untuk mengatasi skenario seperti itu. Untuk ini, Anda perlu memulihkan setiap operasi dan data secara instan. Dengan kata sederhana, Anda harus mempersiapkan organisasi Anda untuk memulihkan semuanya dalam interval sesingkat mungkin bagi pelanggan Anda.
Bencana ada banyak jenisnya, seperti serangan cyber, sabotase, serangan teroris, ransomware atau ancaman fisik, angin topan, gempa bumi, kebakaran, banjir, kecelakaan industri, pemadaman listrik, dan banyak lagi.
Apakah yang Anda maksud: pemulihan bencana

Pemulihan bencana adalah proses mendapatkan kembali operasi normal setelah menderita bencana. Ini melibatkan melanjutkan akses ke perangkat keras, perangkat lunak, peralatan, konektivitas, jaringan, daya, dan data. Anda harus menetapkan aturan dan prosedur dalam proses terdokumentasi untuk mempersiapkan organisasi Anda sebelum bencana.
Namun, jika fasilitas organisasi Anda dihancurkan, Anda harus memperluas beberapa aktivitas dengan mengerjakan komunikasi, transportasi, pengadaan, lokasi kerja, dan banyak lagi.
Mengapa Rencana Pemulihan Bencana Penting?
Menyusun rencana yang sempurna untuk pulih dari bencana, baik alam atau buatan manusia, sangat penting untuk setiap industri TI. Pastikan Anda memiliki karyawan dan alat yang tepat di tempat yang tepat untuk menjalankan rencana dengan lancar.
Mari selami lebih dalam mengapa pemulihan bencana sangat penting.
Batasi Kerusakan
Sebuah bencana tidak dapat diprediksi. Tidak ada yang tahu kapan datang dan pergi. Tapi, Anda bersiap terlebih dahulu untuk mengendalikan kerusakan yang terjadi pada infrastruktur Anda.
Misalnya, di daerah rawan banjir, Anda bisa meletakkan dokumen penting dan jenis peralatan Anda di lantai paling atas untuk menghindari kerusakan.
Demikian pula, buat cadangan data penting Anda sebelum serangan cyber dapat melanggar data atau mencurinya.
Memulihkan Layanan
Jika Anda menyiapkan rencana yang solid untuk pulih dari bencana, memulihkan semua layanan ke bentuk normalnya dengan cepat dan mudah. Artinya, dalam waktu singkat, Anda dapat memulihkan hampir semua aset dan layanan utama.
Minimalkan Interupsi
Anda tidak dapat mengetahui apa yang akan terjadi besok atau pada langkah operasi berikutnya. Namun, dengan rencana pemulihan yang sempurna, Anda tidak perlu terlalu mengkhawatirkan konsekuensinya. Infrastruktur Anda dapat melanjutkan operasi dengan gangguan minimal.
Pelatihan dan Persiapan

Infrastruktur TI terdiri dari banyak karyawan yang bekerja di bawah atap. Semua harus tahu tentang pemulihan untuk bertindak segera seperti yang diperlukan dan diharapkan dalam keadaan darurat.
Persiapan yang tepat juga akan menurunkan tingkat stres semua orang yang terkait dengan organisasi Anda. Selanjutnya, Anda dapat melatih karyawan Anda untuk mengambil tindakan yang diperlukan jika terjadi peristiwa yang tidak terduga.
Terminologi Pemulihan Bencana
Mari kita mulai dengan terminologi untuk memahami pemulihan bencana dari pandangan yang lebih dekat.
RTO
Recovery Time Objective (RTO) adalah jumlah waktu yang ditetapkan organisasi sesuai dengan sifat bisnis untuk menoleransi bencana tanpa mempengaruhi pertumbuhan keuangan.
Saat mengatur RTO, perusahaan harus memeriksa waktu henti yang dapat memengaruhi organisasi Anda dalam banyak hal. Ini digunakan untuk mempelajari strategi yang layak untuk melanjutkan operasi bisnis Anda bahkan setelah bencana. Ketika pelanggan menghadapi gangguan dalam aplikasi, mereka menanyakan berapa lama waktu yang dibutuhkan aplikasi untuk kembali beraksi. Jawabannya adalah RTO untuk setiap organisasi.
Contoh: Misalkan Anda adalah perusahaan transaksi online seperti PayPal atau Pioneer yang menghadapi kejadian yang tidak terduga. Dalam hal ini, RTO Anda akan cukup cepat untuk memulihkan operasi.
Dengan kata lain, perusahaan menetapkan RTO ke satu atau dua jam untuk menghindari konsekuensi dalam bentuk keuangan atau data.
RPO
Recovery Point Objectives (RPO) adalah kehilangan data yang dapat ditangani oleh infrastruktur TI dalam hal waktu dan jumlah informasi.
Membingungkan?
Ambil contoh database yang mencatat transaksi bank, termasuk transfer, penjadwalan, pembayaran, dan lainnya. Ketika bencana terjadi, database dipulihkan secara real-time. Perbedaan antara database pada saat bencana dan pemulihan database setelah bencana adalah nol dalam kasus ini.
Untuk beberapa perusahaan, diperlukan waktu sekitar 24 jam untuk memulihkan semua informasi dari cadangan, tetapi terkadang bisa menjadi bencana besar. Sangat penting untuk mengatur infrastruktur Anda sesuai dengan persyaratan RPO. Ini termasuk meningkatkan frekuensi pencadangan, menambahkan database siaga ke dalam arsitektur Anda, dan banyak lagi.
kegagalan
Pikirkan situasi di mana Anda melakukan perjalanan jarak jauh. Tiba-tiba, Anda mengalami ban kempes karena alasan yang tidak terduga. Anda berterima kasih kepada ban serep yang tersedia di kendaraan Anda dan alat untuk mengganti ban yang rusak.

Failover bekerja dengan cara yang sama.
Ini berarti Anda memerlukan koneksi cadangan selama bencana. Singkatnya, failover berarti memiliki jaringan dan sistem yang dapat Anda gunakan pada saat bencana untuk mengalihkan informasi Anda ke sistem pemulihan.
Failover memastikan semua layanan Anda berjalan dengan lancar, bahkan jika ada kegagalan infrastruktur atau perangkat keras. Dengan cara ini, Anda dapat mencegah organisasi Anda kehilangan data dan pendapatan serta menghindari gangguan layanan bagi pengguna akhir Anda.
Anda dapat mengaturnya secara manual atau membiarkannya berfungsi secara otomatis untuk memindahkan data ke server siaga.
Gagal kembali
Failback TI adalah operasi sederhana di mana produksi asli kembali ke tempat (sistem) aslinya setelah bencana ditangani. Selama serangan, perusahaan mengikuti operasi failover karena semua beban kerja ditransfer ke replika VM atau sistem cadangan.
Namun, Anda tidak bisa begitu saja melewatkan langkah pengembalian berikutnya. Saat Anda memulihkan semuanya dan kembali beraksi, Anda perlu mentransfer semua beban kerja ke VM atau sistem aslinya. Proses keseluruhan mengembalikan beban kerja ke tempat kerja atau sistem asli ini dikenal sebagai failback. Itu berarti Anda akan "kembali" setelah serangan itu.
Failback juga digunakan untuk pemeliharaan terjadwal suatu perusahaan. Memang benar bahwa failback selalu terjadi setelah failover. Dengan kata lain, failover adalah langkah pertama, dan failback adalah langkah kedua dalam memulihkan data penting. Ini dapat diatur antara cloud ke cloud, lokal ke lokal, lokal ke cloud, atau kombinasi apa pun dari ini.
DR
Pemulihan Bencana (DR) adalah proses di mana Anda memiliki rencana yang telah dibuat sebelumnya untuk memulihkan aset Anda dalam jangka waktu tersebut.
DR memberikan kemampuan kepada organisasi untuk merespons dengan cepat dan memulihkan setiap layanan dari kejadian yang tidak terduga. Ini juga memberikan dokumentasi formal yang berisi instruksi untuk mengambil tindakan segera jika terjadi insiden yang tidak terduga.
BCP
Business Continuity Plan (BCP) adalah salah satu rencana pemulihan bencana yang paling dapat diterima yang memungkinkan infrastruktur TI membuat strategi untuk menangani gangguan TI pada server, perangkat seluler, komputer pribadi, dan jaringan.
BCP sedikit berbeda dari pemulihan bencana karena membantu organisasi membuat rencana untuk membangun kembali perangkat lunak dan produktivitas perusahaan untuk memenuhi kebutuhan bisnis utama.
Di sini, perusahaan membuat sistem pemulihan untuk mengatasi potensi ancaman, seperti serangan dunia maya atau bencana alam. Ini dirancang untuk mengamankan aset dan memastikan semua layanan akan kembali beraksi dengan cepat setelah pemogokan.

BCM

Business Continuity Management (BCM) adalah proses manajemen risiko yang dirancang khusus untuk bertindak sebagai perisai terhadap ancaman terhadap proses bisnis. BCM adalah langkah berikutnya dari BCP, di mana ia memvalidasi rencana pemulihan untuk memastikan semua orang dalam bisnis merespons rencana secara instan dan memulihkan semua hal penting.
BCM bertindak sebagai kerangka kerja manajemen untuk mengidentifikasi risiko infrastruktur ketika menghadapi ancaman eksternal dan/atau internal. Ini juga memastikan bahwa kerangka kerja bekerja secara efisien dengan bantuan pengujian reguler untuk meningkatkan prediktabilitas, mengurangi risiko, dan menyelaraskan rencana untuk serangan di masa mendatang.
BIA
Analisis Dampak Bisnis (BIA) adalah proses menganalisis tingkat kelangsungan hidup bisnis dengan mengidentifikasi sistem, operasi, dan proses penting. Ini menceritakan tentang efek bencana pada organisasi Anda karena gangguan dalam operasi Anda.
BIA memprediksi konsekuensi sebelum serangan benar-benar terjadi untuk mengumpulkan informasi penting yang dapat membantu menciptakan strategi pemulihan yang kuat. Ini juga mengidentifikasi biaya yang terlibat karena kegagalan, seperti biaya penggantian peralatan, kehilangan arus kas, keuntungan, gaji, dan banyak lagi.
Saat membuat laporan BIA, Anda harus mempertimbangkan proses penting yang terlibat dalam bisnis Anda, dampak gangguan pada area yang berbeda, durasi yang dapat diterima, area yang dapat ditoleransi, biaya keuangan, dan banyak lagi.
Pohon Panggilan
Pohon panggilan adalah proses kurasi daftar staf untuk dihubungi selama keadaan darurat. Ini adalah prosedur yang mengikuti struktur seperti pohon.
Misalnya, selama bencana, satu orang akan menghubungi sekelompok kecil anggota dengan pesan penting, anggota staf tersebut memanggil setiap kelompok secara terpisah. Dengan cara ini, semua staf akan mendapatkan informasi selama ancaman dan memulai pekerjaan yang ditugaskan untuk memulihkan setiap fungsi dan proses tepat waktu. Membuat daftar itu sederhana tetapi menerapkannya secara real-time menciptakan kebingungan.
Anda harus melakukan aktivitas panggilan secara teratur untuk mempersiapkan setiap anggota staf darurat agar tetap waspada. Pengujian rutin juga dapat membantu mengidentifikasi nomor yang berubah atau hilang yang dapat sangat memengaruhi kinerja.
Pohon panggilan berisi informasi yang akan digunakan selama keadaan darurat untuk menyampaikan instruksi. Itu juga dapat dilakukan secara manual, tetapi orang menggunakan otomatisasi untuk mempercepat proses dan memberi tahu anggota di dunia digital saat ini.
Pusat Komando/Pusat Kontrol
Ini adalah fasilitas virtual atau fisik yang disiapkan secara khusus untuk memberikan perintah atau kontrol atas rencana pemulihan selama krisis. Ini berkomunikasi dengan tim untuk mengelola sistem dan fungsi selama bencana.
Secara tradisional, infrastruktur bergantung pada pusat komando yang menangani krisis tanpa pendekatan yang tepat. Saat ini, organisasi telah merancang pusat kendali mereka dengan sempurna, yang mengubah respons langsung menjadi kompetensi inti.
Setelah merasakan bencana, pusat komando dengan cepat bergerak menuju fase pemulihan. Selain itu, berfungsi sebagai titik pelaporan dalam hal layanan, pers, pengiriman, dan banyak lagi. Ini juga menyatukan orang-orang dari berbagai disiplin ilmu selama skenario seperti itu.
Tanggapan Insiden

Incident response adalah jenis respon yang diberikan untuk menghadapi suatu serangan. Hal ini dilakukan dengan bantuan prosedur dan personel yang tepat untuk menjaga keamanan jaringan dan data secara efektif pada waktu yang tepat.
Jika sebuah organisasi memiliki rencana insiden sebelum kejadian tak terduga, organisasi tersebut dapat mengamankan datanya dari ancaman secara real-time. Spesialis respons insiden selalu waspada terhadap masalah dan bertindak secara alami selama insiden. Mereka mengambil langkah-langkah tertentu untuk menghindari pelanggaran keamanan, memastikan mereka tidak melewatkan satu langkah pun selama pemulihan bencana.
Pada awalnya, Anda harus menentukan data penting dan menyimpannya di cloud atau lokasi terpencil mana pun untuk memastikan keamanan. Atasi kebutuhan infrastruktur saat ini dan ancaman dunia maya yang berkembang dengan memperbarui rencana respons insiden secara teratur.
Cadangan
Solusi pencadangan membantu infrastruktur TI untuk memelihara salinan data dan menyimpannya dengan aman pada waktu yang tepat. Jika Anda menghadapi kerusakan basis data, penghapusan semua data secara tidak sengaja, atau masalah lainnya, Anda harus siap dengan cadangan untuk memulihkan data secara instan dan melanjutkan layanan.

Ini melibatkan mereplikasi file dan menyimpannya di lokasi yang aman untuk mengakses semua data dengan mudah setelah kejadian yang tidak biasa. Ini akan membantu jika Anda mencadangkan data Anda di beberapa lokasi untuk memastikan Anda dapat memulihkannya bahkan jika sebuah situs gagal.
Ketangguhan
Kemampuan komunitas, negara bagian, organisasi, dan individu untuk melawan atau menahan bencana tanpa mengorbankan layanan dan sistem dikenal sebagai ketahanan bencana.
Sebuah organisasi harus siap untuk menahan sejumlah besar stres karena bahaya. Pastikan Anda memiliki kemampuan untuk meminimalkan kerugian Anda dengan perencanaan yang lebih baik daripada menunggu seseorang datang dan menyelamatkan Anda. Ini akan membantu Anda mengakomodasi bencana dan memulihkan infrastruktur TI Anda secara efisien.
Di sini, tujuan utamanya adalah untuk melestarikan dan mengembalikan fungsi dan struktur penting pada waktu yang tepat kapan pun diperlukan. Untuk menjadi organisasi yang tahan bencana, Anda harus mempersiapkan diri terlebih dahulu dan memiliki kemampuan untuk mengantisipasi risiko, menyesuaikan diri dengan perubahan, berbagi dan belajar, mengintegrasikan berbagai sektor, dan mengelola tingkat risiko.
SLA

Service Level Agreement (SLA) adalah rencana bencana di mana Anda menyebutkan kepada pengguna akhir waktu yang mungkin Anda ambil untuk memulihkan layanan selama keadaan darurat.
SLA memastikan pelanggan bahwa data mereka aman dan tidak disusupi atau dibagikan dengan pihak ketiga. Ini adalah satu-satunya titik kontak dengan masalah pengguna akhir.
Setiap infrastruktur TI memberikan jaminan tentang SLA kepada pelanggannya. Jadi, Pastikan Anda berkomunikasi dengan pengguna akhir Anda sebelumnya.
SPOF
Single Point of Failure (SPOF) adalah bagian dari peralatan, individu, sumber daya, atau aplikasi yang terhubung dengan banyak sistem atau aplikasi lain.
Jika peralatan atau sumber daya seperti itu mati, semua bagian penting yang terhubung ke sistem juga ikut mati. Dengan demikian, seluruh proses dan operasi bisnis akan terpengaruh.
Oleh karena itu, Anda harus memiliki strategi untuk menangani masalah tersebut agar organisasi Anda tetap berjalan. Hal pertama yang dapat Anda lakukan adalah mengidentifikasi satu peralatan atau sistem yang dapat berdampak lebih besar. Selanjutnya, jalankan analisis dampak bisnis dan dapatkan skor penilaian risiko untuk mengetahui adegan yang akan terjadi. Gali dan temukan mereka sebelum acara.
Setelah Anda mencantumkan semua SPOF, klasifikasikan menurut proses pemulihan. Tempatkan masing-masing SPOF dalam tiga kategori berbeda:
- Pulihkan dengan mudah dan langsung dengan waktu dan anggaran yang lebih sedikit.
- Pemulihan akan sulit, tetapi proses yang andal dapat dikembangkan untuk memulihkan.
- Tidak ada yang bisa dilakukan untuk memulihkan setelah turun.
Anda dapat bertindak sesuai dengan kategorinya.
Pemulihan sistem
Selama kegagalan perangkat keras, Anda harus menjalankan proses pemulihan untuk mengambil sistem atau server tertentu ke bentuk aslinya. Dan untuk memulihkan seluruh sistem, Anda harus siap dengan persyaratan pemulihan, pencadangan, kompatibilitas firmware, dan kompatibilitas perangkat keras.
Pemulihan sistem adalah proses yang mengatur ulang mesin ke pengaturan sebelumnya atau status yang sama seperti saat baru. Melakukan ini akan menghapus semua infeksi virus karena perangkat lunak atau aplikasi yang diinstal di sistem Anda.
Proses ini mencakup perencanaan pemulihan infrastruktur TI yang menetapkan dan mengikuti prosedur tertentu untuk memastikan ketersediaan data terhadap gangguan buatan atau alami.
Pemulihan Sistem
Pemulihan sistem adalah alat pemulihan yang memungkinkan Anda memulihkan file dan informasi tertentu ke keadaan sebelumnya pada waktu yang tepat.
Dengan pemulihan sistem, Anda dapat memulihkan kunci registri, program yang diinstal, driver, file sistem, dan lainnya kembali ke versi sebelumnya. Ini bertindak sebagai penyelamat dalam banyak bencana.
Rencana Tes
Ini mengacu pada dokumen yang menyimpan informasi tentang strategi pengujian, estimasi, sumber daya, tenggat waktu, tujuan, dan jadwal. Ini berfungsi sebagai cetak biru yang menjalankan tes untuk memastikan keamanan perangkat keras dan perangkat lunak.
Ini termasuk berbagai tes sesuai dengan prosedur dan langkah-langkah yang direncanakan untuk mengelola dampak bencana. Lakukan tes reguler untuk mempersiapkan diri Anda dan organisasi Anda untuk tidak melewatkan satu langkah pun selama tindakan. Dengan cara ini, infrastruktur TI dapat memahami kekurangannya dan siap bertarung.
Kesimpulan
Tidak ada yang tahu kapan bencana akan terjadi. Oleh karena itu, langkah-langkah keselamatan dan keamanan yang tepat sangat penting untuk setiap bisnis.
Terminologi pemulihan bencana akan membantu Anda memahami cara merespons serangan dan bencana. Ini juga akan membantu Anda mempersiapkan diri terlebih dahulu sehingga Anda dapat melindungi infrastruktur Anda selama peristiwa yang tidak terduga. Anda akan dapat membuat strategi pemulihan bencana real-time yang efektif untuk menghemat jutaan dolar dan menahan kepercayaan pelanggan.