Olağanüstü Durum Kurtarma Terminolojilerini Anlama – RTO, RPO, Yük Devretme, BCP ve daha fazlası
Yayınlanan: 2022-03-20Olağanüstü durum kurtarma planı, bir kuruluşun olağandışı bir olay onlara çarpmadan önce sahip olması gereken en önemli önlemdir.
BT endüstrisinde, afet ve afet sonrası etkileriyle ilgili planlar, eylemler ve prosedürleri içeren resmi bir belge oluşturarak başlar.
Afet, önceden haber verilmeksizin aniden ortaya çıkan ve farklı türlerde olabilen bir olaydır. Ve indiğinde, bireyler ve kuruluşlar, finansal sorunlar ve kullanıcı deneyimi dahil olmak üzere pek çok zorlukla karşı karşıya kalır.
Bir saldırı olursa, etkilerini en aza indirmeye ve operasyonlarınızı daha hızlı geri yüklemeye hazır olmalısınız. Pratik bir olağanüstü durum kurtarma planı hazırlamanın, felaketi durdurmanıza veya önlemenize yardımcı olacağı yer burasıdır. Ayrıca kullanıcı deneyimi, maliyet ve arıza süresi açısından sonraki etkilerini de azaltabilirsiniz.
Ayrıca, her şeyi tekrar harekete geçirmek için planlarınızı, insanlarınızı, stratejilerinizi, ekipmanınızı ve sistemlerinizi hazır tutmalısınız. Ancak bunun için felaket kurtarmayı derinlemesine anlamalısınız.
Bu makalede, bu tür olumsuz koşullarda cesurca savaşabilmeniz ve daha güçlü bir şekilde çıkabilmeniz için bunu temel felaket kurtarma terminolojileriyle birlikte ayrıntılı olarak tartışacağım.
Hadi başlayalım!
Afet Nedir?

Afet, BT endüstrisi de dahil olmak üzere herhangi bir yerde meydana gelebilecek öngörülemeyen bir olaydır. Doğal olarak veya insanlar tarafından meydana gelir ve bir şirketin operasyonlarına müdahale edebilir ve altyapının yapısını bozabilir.
Sonuç olarak, bir kuruluş ve müşterileri, satıcıları, çalışanları ve ortakları etkilenir. Finans, sektör itibarı, müşteri güveni ve güvenlik çevresi açısından kuruluş üzerinde baskı oluşturur.
Bu nedenle, böyle bir senaryonun üstesinden gelmek için önceden hazır olmalısınız. Bunun için her işlemi ve veriyi anında kurtarmanız gerekir. Basit bir deyişle, kuruluşunuzu müşterileriniz için mümkün olan en kısa sürede her şeyi kurtarmaya hazırlamanız gerekir.
Afetler, siber saldırılar, sabotaj, terörist saldırılar, fidye yazılımları veya fiziksel tehditler, kasırgalar, depremler, yangınlar, sel, endüstriyel kazalar, elektrik kesintileri ve çok daha fazlası gibi birçok türdendir.
Olağanüstü Durum Kurtarmadan Ne Anlıyorsunuz?

Felaket kurtarma, bir felaketten sonra normal operasyonları yeniden kazanma sürecidir. Donanım, yazılım, ekipman, bağlantı, ağ iletişimi, güç ve verilere erişimi sürdürmeyi içerir. Kuruluşunuzu bir felaketten önce hazırlamak için belgelenmiş bir süreçte kurallar ve prosedürler belirlemelisiniz.
Ancak, kuruluşunuzun tesisleri tahrip olursa, iletişim, ulaşım, kaynak bulma, iş yerleri ve daha fazlası üzerinde çalışarak bazı faaliyetleri genişletmeniz gerekir.
Olağanüstü Durum Kurtarma Planı Neden Önemlidir?
İster doğal ister insan kaynaklı olsun, bir felaketten kurtulmak için mükemmel bir plan hazırlamak her BT sektörü için çok önemlidir. Planı sorunsuz bir şekilde yürütmek için doğru yerde doğru çalışana ve araçlara sahip olduğunuzdan emin olun.
Olağanüstü durum kurtarmanın neden önemli olduğunu daha ayrıntılı olarak inceleyelim.
Limit Hasarları
Bir felaket tahmin edilemez. Ne zaman gelip gittiğini kimse bilmiyor. Ancak altyapınıza verilen zararı kontrol altına almak için önceden hazırlanırsınız.
Örneğin, sele eğilimli alanlarda, hasar görmemesi için temel belgelerinizi ve ekipman türlerini en üst kata yerleştirebilirsiniz.
Benzer şekilde, siber saldırılar verileri ihlal etmeden veya çalmadan önce önemli verilerinizi yedekleyin.
Hizmetleri Geri Yükleme
Felaketten kurtulmak için sağlam bir plan hazırlarsanız, tüm hizmetleri normal hallerine döndürmek hızlı ve kolaydır. Bu, kısa bir zaman aralığında neredeyse tüm önemli varlıkları ve hizmetleri kurtarabileceğiniz anlamına gelir.
Kesintiyi En Aza İndir
Yarın veya bir operasyonun sonraki adımında ne olacağını bilemezsiniz. Ancak, mükemmel bir iyileşme planıyla, sonuçları hakkında fazla endişelenmenize gerek yok. Altyapınız minimum kesinti ile operasyonlarına devam edebilir.
Eğitim ve Hazırlık

Bir BT altyapısı, bir çatı altında çalışan birçok çalışandan oluşur. Acil bir durumda gerektiği ve beklendiği gibi hemen harekete geçmek için herkes kurtarma hakkında bilgi sahibi olmalıdır.
Doğru hazırlık, kuruluşunuzla ilişkili herkesin stres düzeylerini de azaltacaktır. Ayrıca, beklenmedik bir olay meydana geldiğinde gerekli aksiyonları almaları için çalışanlarınızı eğitebilirsiniz.
Olağanüstü Durum Kurtarma Terminolojileri
Felaket kurtarmayı daha yakından anlamak için terminolojilerle başlayalım.
RTO
Kurtarma Süresi Hedefi (RTO), bir kuruluşun finansal büyümeyi etkilemeden felaketi tolere etmek için işin doğasına göre belirlediği süredir.
Bir şirket, RTO'yu ayarlarken, kuruluşunuzu birçok yönden etkileyebilecek duruş sürelerini kontrol etmelidir. Bir felaketten sonra bile iş operasyonlarınızı sürdürmek için uygulanabilir stratejileri incelemek için kullanılır. Müşteriler uygulamada herhangi bir rahatsızlıkla karşılaştıklarında, bir uygulamanın harekete geri dönmesinin ne kadar süreceğini soruyorlar. Cevap, her kuruluş için RTO'dur.
Örnek: Tahmin edilemeyen olaylarla karşı karşıya olan PayPal veya Pioneer gibi bir çevrimiçi işlem şirketi olduğunuzu varsayalım. Bu durumda, RTO'nuz işlemi kurtarmak için yeterince hızlı olacaktır.
Başka bir deyişle, bir şirket, finans veya veri biçimindeki sonuçlardan kaçınmak için RTO'sunu bir veya iki saate ayarlar.
RPO
Kurtarma Noktası Hedefleri (RPO), bir BT altyapısının zaman ve bilgi miktarı açısından kaldırabileceği veri kaybıdır.
Kafa karıştırıcı?
Transferler, zamanlama, ödemeler ve daha fazlası dahil olmak üzere bir bankanın işlemlerini kaydeden bir veritabanı örneğini alın. Bir felaket olduğunda, veritabanı gerçek zamanlı olarak kurtarılır. Bu durumda, felaket anında veritabanı ile bir felaketten sonra veritabanı kurtarma arasındaki fark sıfırdır.
Bazı şirketler için, yedekteki tüm bilgilerin kurtarılması yaklaşık 24 saat sürebilir, ancak bazen felaket olabilir. Altyapınızı RPO gereksinimlerine göre ayarlamak esastır. Bu, yedekleme sıklığını artırmayı, mimarinize yedek bir veritabanı eklemeyi ve daha fazlasını içerir.
yük devretme
Uzun bir mesafe seyahat ettiğiniz bir durumu düşünün. Aniden, beklenmedik bir nedenden dolayı lastiğiniz patladı. Aracınızda bulunan yedek lastiğe ve arızalı lastiği değiştirecek araçlara teşekkür edersiniz.

Yük devretme aynı şekilde çalışır.
Bu, felaket sırasında yedek bir bağlantıya ihtiyacınız olduğu anlamına gelir. Özetle, yük devretme, bir felaket anında bilgilerinizi kurtarma sistemine geçirmek için kullanabileceğiniz ağlara ve sistemlere sahip olmak anlamına gelir.
Yük devretme, altyapı veya donanım arızaları olsa bile tüm hizmetlerinizin sorunsuz çalışmasını sağlar. Bu şekilde, kuruluşunuzun veri ve gelir kaybetmesini önleyebilir ve son kullanıcılarınız için hizmet kesintilerini önleyebilirsiniz.
Verileri bekleme sunucusuna taşımak için manuel olarak ayarlayabilir veya otomatik olarak çalışmasına izin verebilirsiniz.
yeniden çalışma
BT yeniden çalışma, bir felaket ele alındıktan sonra orijinal üretimin orijinal yerine (sistem) geri döndüğü basit bir işlemdir. Saldırı sırasında şirketler, tüm iş yüklerinin bir VM replikasına veya yedekleme sistemine aktarılması nedeniyle bir yük devretme operasyonu izler.
Ancak, bir sonraki geri dönüş adımını atlayamazsınız. Her şeyi kurtardığınızda ve tekrar harekete geçtiğinizde, tüm iş yüklerini orijinal VM'lerine veya sistemlerine aktarmanız gerekir. İş yüklerini orijinal iş yerine veya sisteme döndürmeye yönelik bu genel süreç, yeniden çalışma olarak bilinir. Bu, saldırıdan sonra “geri geleceğiniz” anlamına gelir.
Yeniden çalışma, bir işletmenin planlı bakımı için de kullanılır. Başarısızlığın her zaman yük devretmeden sonra gerçekleştiği doğrudur. Başka bir deyişle, yük devretme ilk adımdır ve yeniden çalışma, temel verileri kurtarmanın ikinci adımıdır. Buluttan buluta, şirket içinden şirket içine, şirket içinden buluta veya bunların herhangi bir kombinasyonu arasında kurulabilir.
doktor
Olağanüstü Durum Kurtarma (DR), varlıklarınızı zaman çerçevesi içinde kurtarmak için önceden oluşturulmuş planlarınız olduğu süreçtir.
DR, bir kuruluşa hızlı yanıt verme ve beklenmedik bir olaydan her hizmeti kurtarma yeteneği verir. Ayrıca, öngörülemeyen olaylar durumunda acil önlem alınmasına ilişkin talimatları içeren resmi belgeler de sağlar.
BCP
İş Sürekliliği Planı (BCP), BT altyapısının sunucularda, mobil cihazlarda, kişisel bilgisayarlarda ve ağlarda BT kesintileriyle başa çıkmak için stratejiler oluşturmasına olanak tanıyan en kabul edilebilir felaket kurtarma planlarından biridir.
BCP, bir kuruluşun temel iş ihtiyaçlarını karşılamak için kurumsal yazılımları ve üretkenliği yeniden kurmaya yönelik planlar yapmasına yardımcı olduğu için olağanüstü durum kurtarmadan biraz farklıdır.

Burada bir şirket, siber saldırılar veya doğal afetler gibi potansiyel tehditlerin üstesinden gelmek için bir kurtarma sistemi oluşturur. Varlıkları güvence altına almak ve grevden sonra tüm hizmetlerin hızla yeniden faaliyete geçmesini sağlamak için tasarlanmıştır.
BCM

İş Sürekliliği Yönetimi (BCM), iş süreçlerine yönelik tehditlere karşı bir kalkan görevi görmek üzere özel olarak tasarlanmış bir risk yönetimi sürecidir. BCM, işletmedeki herkesin plana anında yanıt vermesini ve tüm gerekli şeyleri kurtarmasını sağlamak için kurtarma planlarını doğruladığı BCP'nin bir sonraki adımıdır.
BCM, dış ve/veya iç tehditlerle karşı karşıya kaldığında altyapı risklerini belirlemek için bir yönetim çerçevesi görevi görür. Ayrıca, öngörülebilirliği artırmak, riski azaltmak ve gelecekteki saldırılar için planı hizalamak için düzenli testlerin yardımıyla çerçevenin verimli bir şekilde çalışmasını sağlar.
BİA
İş Etki Analizi (BIA), önemli sistemleri, operasyonları ve süreçleri belirleyerek bir işletmenin hayatta kalma oranını analiz etme sürecidir. Operasyonlarınızdaki kesinti nedeniyle bir felaketin organizasyonunuz üzerindeki etkisini anlatır.
BIA, güçlü kurtarma stratejileri oluşturmaya yardımcı olabilecek önemli bilgileri toplamak için bir saldırı gerçekleşmeden önce sonuçları tahmin eder. Ayrıca, ekipmanın değiştirme maliyeti, nakit akışı kaybı, karlar, maaşlar ve daha fazlası gibi arızalardan kaynaklanan maliyetleri de tanımlar.
Bir BIA raporu oluştururken, işinizle ilgili önemli süreçleri, kesintilerin farklı alanlardaki etkisini, kabul edilebilir süreyi, kabul edilebilir alanları, finansal maliyetleri ve daha fazlasını göz önünde bulundurmalısınız.
Çağrı Ağacı
Çağrı ağacı, acil bir durumda aranacak bir personel listesi oluşturma sürecidir. Ağaç benzeri bir yapıyı takip eden bir prosedürdür.
Örneğin, bir afet sırasında, bir kişi küçük bir grup üyeyle acil bir mesajla iletişime geçecek, bu personel üyeleri her grubu ayrı ayrı arayacaktır. Bu şekilde, tüm personel tehdit anında bilgilendirilir ve her işlevi ve süreci zamanında kurtarmak için atanan göreve başlar. Liste yapmak basittir ancak onu gerçek zamanlı olarak uygulamak kafa karışıklığı yaratır.
Her acil durum personelini tetikte kalmaya hazırlamak için düzenli arama faaliyetleri gerçekleştirmelisiniz. Düzenli testler, performansı ciddi şekilde etkileyebilecek değişen veya eksik sayıların belirlenmesine de yardımcı olabilir.
Çağrı ağacı, acil durumlarda talimatları iletmek için kullanılacak bilgileri içerir. Manuel olarak da yapılabilir, ancak günümüzün dijital dünyasında insanlar süreci hızlandırmak ve üyeleri bilgilendirmek için otomasyonu kullanıyor.
Komuta Merkezi/Kontrol Merkezi
Bir kriz sırasında kurtarma planları üzerinde komuta veya kontrol sağlamak için özel olarak hazırlanmış sanal veya fiziksel bir tesistir. Afet sırasında sistem ve fonksiyonları yönetmek için ekiple iletişim kurar.
Geleneksel olarak altyapı, herhangi bir uygun yaklaşım olmaksızın krizlerle ilgilenen komuta merkezine bağlıdır. Günümüzde kuruluşlar, kontrol merkezlerini mükemmel bir şekilde tasarladılar ve bu da anında yanıtı temel yetkinliğe dönüştürüyor.
Bir felaketi algıladığında, komuta merkezi hızla kurtarma aşamasına geçer. Ayrıca hizmetler, basın, teslimatlar ve daha pek çok konuda raporlama noktası görevi görür. Ayrıca bu tür senaryolar sırasında birden fazla disiplinden insanları bir araya getiriyor.
Olay Müdahalesi

Olay yanıtı, bir saldırıyla başa çıkmak için verilen bir yanıt türüdür. Ağ ve veri güvenliğinin doğru zamanda etkin bir şekilde korunması için doğru prosedürler ve personel yardımıyla yapılır.
Bir kuruluşun beklenmedik olaydan önce bir olay planı varsa, verilerini gerçek zamanlı olarak tehditlere karşı koruyabilir. Olay müdahale uzmanları, her zaman sorunlara karşı tetikte kalır ve bir olay sırasında doğal olarak hareket eder. Felaket kurtarma sırasında tek bir adımı atlamamalarını sağlayarak güvenlik ihlallerini önlemek için belirli önlemler alırlar.
Başlangıçta, güvenliği sağlamak için kritik verileri belirlemeli ve bulutta veya herhangi bir uzak yerde saklamalısınız. Olay müdahale planlarını düzenli olarak güncelleyerek mevcut altyapı ihtiyaçlarını ve gelişen siber tehditleri ele alın.
Destek olmak
Yedekleme çözümleri, bir BT altyapısının verilerin kopyalarını korumasına ve doğru zamanda güvenli bir şekilde saklamasına yardımcı olur. Veritabanı bozulması, tüm verilerin yanlışlıkla silinmesi veya başka bir sorunla karşılaşırsanız, verileri anında geri yüklemek ve hizmetlere devam etmek için yedeklemeye hazır olmalısınız.

Olağandışı bir olaydan sonra tüm verilere kolayca erişmek için dosyaları çoğaltmayı ve güvenli bir yerde saklamayı içerir. Bir site başarısız olsa bile geri yükleyebilmenizi sağlamak için verilerinizi birden çok konumda yedeklemeniz yardımcı olacaktır.
Dayanıklılık
Toplulukların, devletlerin, kuruluşların ve bireylerin, hizmetlerden ve sistemlerden ödün vermeden bir afete direnme veya dayanma yeteneği, afet direnci olarak bilinir.
Bir kuruluş, tehlikeler nedeniyle büyük miktarda stresi tutmaya hazır olmalıdır. Birinin gelip sizi kurtarmasını beklemek yerine daha iyi bir planlama ile kayıplarınızı en aza indirecek yeteneklere sahip olduğunuzdan emin olun. Bu, felaketlere uyum sağlamanıza ve BT altyapınızı verimli bir şekilde kurtarmanıza yardımcı olacaktır.
Burada temel amaç, gerekli işlev ve yapıların gerektiğinde doğru zamanda korunması ve restore edilmesidir. Afete dayanıklı bir organizasyon olmak için önceden hazırlanmalı ve riskleri tahmin etme, değişikliklere uyum sağlama, paylaşma ve öğrenme, çeşitli sektörleri entegre etme ve risk seviyelerini yönetme yeteneğine sahip olmalısınız.
SLA

Hizmet Düzeyi Sözleşmesi (SLA), acil bir durumda hizmetleri geri yüklemek için ne kadar zaman harcayabileceğinizi son kullanıcılara belirttiğiniz bir felaket planıdır.
SLA, müşterilerin verilerinin güvende olmasını ve üçüncü taraflarla paylaşılmamasını sağlar. Son kullanıcı sorunlarıyla tek temas noktasıdır.
Her BT altyapısı, müşterilerine SLA konusunda güvence verir. Bu nedenle, son kullanıcılarınızla önceden iletişim kurduğunuzdan emin olun.
SPOF
Tek Hata Noktası (SPOF), diğer birçok sistem veya uygulamanın bağlı olduğu bir ekipman, birey, kaynak veya uygulama parçasıdır.
Böyle bir ekipman veya kaynak bozulursa, sisteme bağlı tüm önemli parçalar da onunla birlikte aşağı iner. Böylece, tüm süreç ve iş operasyonu etkilenecektir.
Bu nedenle, kuruluşunuzu çalışır durumda tutmak için böyle bir sorunu ele alacak bir stratejiniz olmalıdır. Yapabileceğiniz ilk şey, daha fazlasını etkileyebilecek tek parça ekipmanı veya sistemi belirlemektir. Ardından, bir iş etki analizi yapın ve olacak sahnelerin farkında olmak için bir risk değerlendirme puanı alın. Olaydan önce kazın ve onları bulun.
Tüm SPOF'ları listeledikten sonra, bunları kurtarma işlemine göre sınıflandırın. SPOF'un her birini üç farklı kategoriye koyun:
- Daha az zaman ve bütçe ile kolayca ve doğrudan kurtarın.
- Kurtarma zor olurdu, ancak geri yüklemek için güvenilir bir süreç geliştirilebilir.
- Düştüğünde kurtarmak için hiçbir şey yapılamaz.
Kategoriye göre hareket edebilirsiniz.
Sistem kurtarma
Donanım arızası sırasında, belirli sistemi veya sunucuyu orijinal biçimine geri almak için bir kurtarma işlemi çalıştırmanız gerekir. Ve tüm sistemi kurtarmak için kurtarma gereksinimleri, yedeklemeler, bellenim uyumluluğu ve donanım uyumluluğu ile hazır olmanız gerekir.
Sistem kurtarma, makineyi önceki ayarlarına veya yeni olduğu zamanki durumuna sıfırlayan bir işlemdir. Bunu yapmak, sisteminizde yüklü yazılım veya uygulamalardan kaynaklanan tüm virüs bulaşmalarını siler.
Bu süreç, insan kaynaklı veya doğal kesintilere karşı veri kullanılabilirliğini sağlamak için belirli prosedürleri belirleyen ve izleyen bir BT altyapısının kurtarma planlamasını içerir.
Sistem Geri Yükleme
Sistem geri yükleme, belirli dosyaları ve bilgileri doğru zamanda önceki durumlarına geri yüklemenizi sağlayan bir kurtarma aracıdır.
Sistem geri yükleme ile kayıt defteri anahtarlarını, yüklü programları, sürücüleri, sistem dosyalarını ve daha fazlasını önceki sürümüne geri döndürebilirsiniz. Bu, birçok felakette cankurtaran görevi görür.
Test planı
Bir test stratejisi, tahminler, kaynaklar, son tarihler, hedefler ve çizelgeler hakkında bilgi depolayan bir belgeye atıfta bulunur. Donanım ve yazılım güvenliğini sağlamak için testler yapan bir plan olarak çalışır.
Bu, afet sonrası etkileri yönetmek için planlanan prosedürlere ve adımlara göre çeşitli testleri içerir. Kendinizi ve kurumunuzu hareket sırasında tek bir adımı atlamamaya hazırlamak için düzenli testler yapın. Bu şekilde, bir BT altyapısı eksiklikleri anlayabilir ve mücadeleye hazır olabilir.
Çözüm
Bir felaketin ne zaman olacağını kimse bilemez. Bu nedenle, her işletme için uygun güvenlik ve güvenlik önlemleri gereklidir.
Olağanüstü durum kurtarma terminolojileri, saldırılara ve felaketlere nasıl yanıt verileceğini anlamanıza yardımcı olacaktır. Ayrıca, beklenmedik bir olay sırasında altyapınızı koruyabilmeniz için önceden hazırlanmanıza yardımcı olacaktır. Milyonlarca dolar tasarruf etmek ve müşteri güvenini kaybetmek için etkili, gerçek zamanlı bir olağanüstü durum kurtarma stratejisi oluşturabileceksiniz.