فهم مصطلحات التعافي من الكوارث - RTO و RPO و Failover و BCP والمزيد
نشرت: 2022-03-20خطة التعافي من الكوارث هي الإجراء الأول الذي يجب على المنظمة اتباعه قبل وقوع حدث غير عادي.
في صناعة تكنولوجيا المعلومات ، يبدأ بإنشاء مستند رسمي يحتوي على خطط وإجراءات وإجراءات للتعامل مع الكارثة وآثارها اللاحقة.
الكارثة هي حدث يأتي فجأة بدون إشعار مسبق ويمكن أن يكون من أنواع مختلفة. وعندما تهبط ، يواجه الأفراد والمؤسسات صعوبات من عدة أنواع ، بما في ذلك المشكلات المالية وتجربة المستخدم.
في حالة حدوث هجوم ، يجب أن تكون مستعدًا لتقليل آثاره واستعادة عملياتك بشكل أسرع. هذا هو المكان الذي سيساعدك فيه إعداد خطة عملية للتعافي من الكوارث على منع وقوع الكارثة أو منعها. يمكنك أيضًا تقليل آثارها اللاحقة من حيث تجربة المستخدم والتكلفة ووقت التوقف.
بالإضافة إلى ذلك ، يجب أن تبقي خططك وأفرادك واستراتيجياتك ومعداتك وأنظمتك جاهزة لإعادة كل شيء إلى العمل. ولكن لهذا ، يجب أن تفهم التعافي من الكوارث بعمق.
في هذه المقالة ، سأناقش هذا بالتفصيل جنبًا إلى جنب مع مصطلحات التعافي من الكوارث الرئيسية حتى تتمكن من القتال بشجاعة والخروج أقوى في مثل هذه الظروف المعاكسة.
هيا نبدأ!
ما هي الكارثة؟

الكارثة هي حدث غير متوقع يمكن أن يحدث في أي مكان ، بما في ذلك صناعة تكنولوجيا المعلومات. تحدث بشكل طبيعي أو عن طريق الأشخاص ويمكن أن تتداخل مع عمليات الشركة وتعكير صفو البنية التحتية.
نتيجة لذلك ، تتأثر المؤسسة وعملائها وموردوها وموظفوها وشركاؤها. إنه يضع ضغطًا على المنظمة من حيث الشؤون المالية وسمعة الصناعة وثقة العملاء والمحيط الأمني.
ومن ثم ، يجب أن تكون مستعدًا مسبقًا للتغلب على مثل هذا السيناريو. لهذا ، تحتاج إلى استعادة كل عملية وبيانات على الفور. بكلمات بسيطة ، يجب أن تعد مؤسستك لاستعادة كل شيء في أقصر فترة زمنية ممكنة لعملائك.
تتعدد أنواع الكوارث ، مثل الهجمات الإلكترونية والتخريب والهجمات الإرهابية وبرامج الفدية أو التهديدات الجسدية والأعاصير والزلازل والحرائق والفيضانات والحوادث الصناعية وانقطاع التيار الكهربائي وغير ذلك الكثير.
ماذا تقصد بالتعافي من الكوارث؟

التعافي من الكوارث هو عملية استعادة العمليات الطبيعية بعد المعاناة من كارثة. يتضمن استئناف الوصول إلى الأجهزة والبرامج والمعدات والاتصال والشبكات والطاقة والبيانات. يجب عليك وضع القواعد والإجراءات في عملية موثقة لإعداد مؤسستك قبل وقوع كارثة.
ومع ذلك ، إذا تم تدمير مرافق مؤسستك ، فيجب عليك توسيع بعض الأنشطة من خلال العمل على الاتصالات والنقل وتحديد المصادر ومواقع العمل والمزيد.
لماذا تعتبر خطة التعافي من الكوارث مهمة؟
تعد صياغة خطة مثالية للتعافي من كارثة ، سواء كانت طبيعية أو من صنع الإنسان ، أمرًا ضروريًا لكل صناعة تكنولوجيا المعلومات. تأكد من أن لديك الموظف والأدوات المناسبة في المكان المناسب لتنفيذ الخطة بسلاسة.
دعونا نتعمق أكثر في سبب أهمية التعافي من الكوارث.
الحد من الأضرار
كارثة لا يمكن التنبؤ بها. لا أحد يعرف متى يأتي ويذهب. لكنك تستعد مسبقًا للتحكم في الأضرار التي لحقت بالبنية التحتية الخاصة بك.
على سبيل المثال ، في المناطق المعرضة للفيضانات ، يمكنك وضع المستندات الأساسية وأنواع المعدات في الطابق العلوي لتجنب التلف.
وبالمثل ، احتفظ بنسخة احتياطية من بياناتك الأساسية قبل أن تتمكن الهجمات الإلكترونية من اختراق البيانات أو سرقتها.
استعادة الخدمات
إذا قمت بإعداد خطة قوية للتعافي من الكارثة ، فإن استعادة جميع الخدمات إلى شكلها الطبيعي تكون سريعة وسهلة. هذا يعني أنه في فترة زمنية قصيرة ، يمكنك استرداد جميع الأصول والخدمات الرئيسية تقريبًا.
تقليل الانقطاع
لا يمكنك معرفة ما سيحدث غدًا أو في الخطوة التالية من العملية. ولكن مع وجود خطة تعافي مثالية ، لا داعي للقلق بشأن العواقب كثيرًا. يمكن للبنية التحتية الخاصة بك أن تواصل العمليات بأقل قدر من الانقطاع.
التدريب والإعداد

تتكون البنية التحتية لتكنولوجيا المعلومات من العديد من الموظفين الذين يعملون تحت سقف. يجب أن يعرف الجميع عن التعافي للعمل فورًا كما هو مطلوب ومتوقع في حالة الطوارئ.
سيؤدي التحضير المناسب أيضًا إلى تقليل مستويات التوتر لدى كل شخص مرتبط بمؤسستك. علاوة على ذلك ، يمكنك تدريب موظفيك على اتخاذ الإجراءات اللازمة في حالة وقوع حدث غير متوقع.
مصطلحات التعافي من الكوارث
لنبدأ بالمصطلحات لفهم التعافي من الكوارث من منظور أقرب.
RTO
هدف وقت الاسترداد (RTO) هو مقدار الوقت الذي تحدده المؤسسة وفقًا لطبيعة العمل لتحمل الكوارث دون التأثير على النمو المالي.
أثناء تعيين RTO ، يجب على الشركة التحقق من فترات التوقف التي قد تؤثر على مؤسستك بعدة طرق. يتم استخدامه لدراسة الاستراتيجيات القابلة للتطبيق لمواصلة عملياتك التجارية حتى بعد وقوع كارثة. عندما يواجه العملاء أي اضطرابات في التطبيق ، فإنهم يسألون عن مقدار الوقت الذي سيستغرقه التطبيق للعودة إلى الإجراء. الجواب هو RTO لكل منظمة.
مثال: لنفترض أنك شركة معاملات عبر الإنترنت مثل PayPal أو Pioneer تواجه أحداثًا غير متوقعة. في هذه الحالة ، سيكون RTO سريعًا بما يكفي لاستعادة العملية.
بمعنى آخر ، تحدد الشركة RTO الخاص بها لمدة ساعة أو ساعتين لتجنب العواقب في شكل تمويل أو بيانات.
RPO
أهداف نقطة الاسترداد (RPO) هي فقدان البيانات الذي يمكن أن تتعامل معه البنية التحتية لتكنولوجيا المعلومات من حيث الوقت وكمية المعلومات.
مربك؟
خذ مثالاً لقاعدة بيانات تسجل معاملات البنك ، بما في ذلك التحويلات والجدولة والمدفوعات والمزيد. عند حدوث كارثة ، يتم استرداد قاعدة البيانات في الوقت الفعلي. الفرق بين قاعدة البيانات في وقت حدوث كارثة واستعادة قاعدة البيانات بعد وقوع كارثة هو صفر في هذه الحالة.
بالنسبة لبعض الشركات ، من المقبول أن تستغرق حوالي 24 ساعة لاستعادة جميع المعلومات من النسخة الاحتياطية ، ولكن قد يكون ذلك كارثيًا في بعض الأحيان. من الضروري ضبط البنية التحتية الخاصة بك وفقًا لمتطلبات RPO. يتضمن ذلك تحسين وتيرة النسخ الاحتياطية وإضافة قاعدة بيانات بديلة إلى بنيتك والمزيد.
تجاوز الفشل
فكر في موقف تسافر فيه لمسافة طويلة. فجأة ، لديك ثقب في الإطارات بسبب سبب غير متوقع. أنت تشكر الإطار الاحتياطي المتاح في سيارتك والأدوات اللازمة لتغيير الإطار المعيب.

يعمل تجاوز الفشل بنفس الطريقة.
هذا يعني أنك بحاجة إلى اتصال احتياطي أثناء الكارثة. باختصار ، يعني تجاوز الفشل وجود شبكات وأنظمة يمكنك استخدامها في وقت وقوع كارثة لتحويل معلوماتك إلى نظام الاسترداد.
يضمن تجاوز الفشل أن جميع خدماتك تعمل بسلاسة ، حتى إذا كان هناك أعطال في البنية التحتية أو الأجهزة. بهذه الطريقة ، يمكنك منع مؤسستك من فقدان البيانات والأرباح وتجنب انقطاع الخدمة للمستخدمين النهائيين.
يمكنك إما ضبطه يدويًا أو السماح له بالعمل تلقائيًا لنقل البيانات إلى خادم الاستعداد.
الفشل
إعادة فشل تكنولوجيا المعلومات هي عملية بسيطة حيث يعود الإنتاج الأصلي إلى مكانه الأصلي (النظام) بعد معالجة الكارثة. أثناء الهجوم ، تتبع الشركات عملية تجاوز الفشل بسبب نقل جميع أعباء العمل إلى نسخة متماثلة VM أو نظام نسخ احتياطي.
ومع ذلك ، لا يمكنك فقط تخطي الخطوة التالية للعودة. عندما تستعيد كل شيء وتعود إلى العمل ، فأنت بحاجة إلى نقل جميع أعباء العمل إلى الأجهزة الافتراضية أو الأنظمة الأصلية الخاصة بها. تُعرف هذه العملية الشاملة لإعادة أعباء العمل إلى مكان العمل الأصلي أو النظام الأصلي باسم إعادة التحميل. هذا يعني أنك ستعود بعد الهجوم.
يتم استخدام Failback أيضًا في الصيانة المجدولة للمؤسسة. صحيح أن إعادة الفشل تحدث دائمًا بعد تجاوز الفشل. بمعنى آخر ، تجاوز الفشل هو الخطوة الأولى ، والعودة إلى الفشل هي الخطوة الثانية في استعادة البيانات الأساسية. يمكن إعداده بين السحابة إلى السحابة ، من أماكن العمل إلى أماكن العمل ، من المحلية إلى السحابة ، أو أي مجموعة من هذه.
الدكتور
التعافي من الكوارث (DR) هو العملية التي يكون لديك فيها خطط مسبقة الصنع لاستعادة أصولك في غضون الإطار الزمني.
يعطي DR القدرة للمؤسسة على الاستجابة بسرعة واستعادة كل خدمة من حدث غير متوقع. كما يقدم وثائق رسمية تحتوي على تعليمات بشأن اتخاذ إجراءات فورية في حالة وقوع حوادث غير متوقعة.
BCP
خطة استمرارية الأعمال (BCP) هي واحدة من أكثر خطط التعافي من الكوارث المقبولة والتي تسمح للبنية التحتية لتكنولوجيا المعلومات بوضع استراتيجيات للتعامل مع اضطرابات تكنولوجيا المعلومات للخوادم والأجهزة المحمولة وأجهزة الكمبيوتر الشخصية والشبكات.
يختلف BCP قليلاً عن التعافي من الكوارث لأنه يساعد المؤسسة على وضع خطط لإعادة إنشاء برامج المؤسسة والإنتاجية لتلبية احتياجات العمل الرئيسية.
هنا ، تقوم الشركة بإنشاء نظام استرداد للتغلب على التهديدات المحتملة ، مثل الهجمات الإلكترونية أو الكوارث الطبيعية. إنه مصمم لتأمين الأصول والتأكد من أن جميع الخدمات ستعود للعمل بسرعة بعد الإضراب.

مليار متر مكعب

إدارة استمرارية الأعمال (BCM) هي عملية إدارة مخاطر مصممة خصيصًا لتكون بمثابة درع ضد التهديدات التي تتعرض لها العمليات التجارية. BCM هي الخطوة التالية في BCP ، حيث تقوم بالتحقق من صحة خطط الاسترداد للتأكد من أن كل فرد في الشركة يستجيب للخطة على الفور ويستعيد جميع الأشياء الأساسية.
تعمل BCM كإطار عمل إداري لتحديد مخاطر البنية التحتية عندما تواجه تهديدات خارجية و / أو داخلية. كما أنه يضمن أن إطار العمل يعمل بكفاءة بمساعدة الاختبار المنتظم لتعزيز القدرة على التنبؤ وتقليل المخاطر ومواءمة الخطة للهجمات المستقبلية.
BIA
تحليل تأثير الأعمال (BIA) هو عملية تحليل معدل بقاء الأعمال التجارية من خلال تحديد الأنظمة والعمليات والعمليات الحاسمة. إنه يتحدث عن تأثير كارثة على مؤسستك بسبب انقطاع عملياتك.
يتنبأ BIA بالعواقب قبل حدوث هجوم فعليًا من أجل جمع المعلومات الأساسية التي يمكن أن تساعد في إنشاء استراتيجيات استرداد قوية. كما تحدد التكلفة المتضمنة بسبب الإخفاقات ، مثل تكلفة استبدال المعدات ، وفقدان التدفق النقدي ، والأرباح ، والمرتبات ، والمزيد.
عند إنشاء تقرير BIA ، يجب أن تأخذ في الاعتبار العمليات الحاسمة التي ينطوي عليها عملك ، وتأثير الاضطرابات في مناطق مختلفة ، والمدة المقبولة ، والمناطق المسموح بها ، والتكاليف المالية ، والمزيد.
Call Tree
شجرة الاتصال هي عملية تنظيم قائمة بالموظفين للاتصال بهم أثناء حالة الطوارئ. إنه إجراء يتبع بنية تشبه الشجرة.
على سبيل المثال ، أثناء وقوع كارثة ، سيتصل شخص واحد بمجموعة صغيرة من الأعضاء برسالة عاجلة ، ويقوم هؤلاء الموظفون بالاتصال بكل مجموعة على حدة. بهذه الطريقة ، سيتم إبلاغ جميع الموظفين أثناء التهديد وبدء عملهم المخصص لاستعادة كل وظيفة وعملية في الوقت المناسب. يعد إنشاء قائمة أمرًا بسيطًا ولكن تنفيذها في الوقت الفعلي يؤدي إلى حدوث ارتباك.
يجب عليك إجراء أنشطة مكالمات منتظمة لإعداد كل موظف في حالات الطوارئ للبقاء في حالة تأهب. يمكن أن يساعد الاختبار المنتظم أيضًا في تحديد الأرقام المتغيرة أو المفقودة التي يمكن أن تؤثر بشدة على الأداء.
تحتوي شجرة الاتصال على معلومات لاستخدامها أثناء حالة الطوارئ لإيصال التعليمات. يمكن أيضًا القيام بذلك يدويًا ، لكن الناس يستخدمون الأتمتة لتسريع العملية وإخطار الأعضاء في العالم الرقمي اليوم.
مركز القيادة / مركز التحكم
إنها منشأة افتراضية أو مادية مُعدة خصيصًا لتوفير القيادة أو التحكم في خطط الاسترداد أثناء الأزمة. يتواصل مع الفريق لإدارة الأنظمة والوظائف أثناء الكارثة.
تقليديا ، تعتمد البنية التحتية على مركز القيادة الذي يتعامل مع الأزمات دون أي نهج مناسب. في الوقت الحاضر ، صممت المنظمات مركز التحكم الخاص بها بشكل مثالي ، مما يحول الاستجابة الفورية إلى الكفاءة الأساسية.
بمجرد استشعار الكارثة ، يتجه مركز القيادة بسرعة نحو مرحلة التعافي. علاوة على ذلك ، فهي بمثابة نقطة الإبلاغ في حالة الخدمات والصحافة والتسليم والمزيد. كما أنه يجمع أشخاصًا من تخصصات متعددة خلال مثل هذه السيناريوهات.
الاستجابة للحادث

الرد على الحادث هو نوع من الاستجابة يتم تقديمه للتعامل مع الهجوم. يتم ذلك بمساعدة الإجراءات والموظفين المناسبين للحفاظ على أمن الشبكة والبيانات بشكل فعال في الوقت المناسب.
إذا كان لدى منظمة خطة حادث قبل الحدث غير المتوقع ، فيمكنها تأمين بياناتها من التهديدات في الوقت الفعلي. يظل متخصصو الاستجابة للحوادث دائمًا في حالة تأهب للمشكلات ويتصرفون بشكل طبيعي أثناء وقوع الحادث. يتخذون إجراءات معينة لتجنب الانتهاكات الأمنية ، والتأكد من أنهم لا يتخطون خطوة واحدة أثناء التعافي من الكوارث.
في البداية ، يجب عليك تحديد البيانات الهامة وتخزينها في السحابة أو أي مكان بعيد لضمان السلامة. قم بمعالجة احتياجات البنية التحتية الحالية والتهديدات الإلكترونية المتطورة من خلال تحديث خطط الاستجابة للحوادث بانتظام.
دعم
تساعد حلول النسخ الاحتياطي البنية التحتية لتكنولوجيا المعلومات في الاحتفاظ بنسخ من البيانات وتخزينها بأمان في الوقت المناسب. إذا واجهت تلفًا في قاعدة البيانات ، أو حذفًا عرضيًا لجميع البيانات ، أو أي مشكلة أخرى ، فيجب أن تكون جاهزًا بالنسخة الاحتياطية لاستعادة البيانات على الفور ومواصلة الخدمات.

يتضمن نسخ الملفات وتخزينها في مكان آمن للوصول إلى جميع البيانات بسهولة بعد حدث غير عادي. سيساعدك إذا قمت بعمل نسخة احتياطية من بياناتك في مواقع متعددة للتأكد من أنه يمكنك استعادتها حتى في حالة فشل أحد المواقع.
تكيف
تُعرف قدرة المجتمعات والدول والمنظمات والأفراد على مقاومة الكارثة أو تحملها دون المساس بالخدمات والأنظمة بالمرونة في مواجهة الكوارث.
يجب أن تكون المنظمة مستعدة لحجب قدر كبير من الإجهاد بسبب المخاطر. تأكد من أن لديك القدرات لتقليل الخسائر إلى أدنى حد ممكن من خلال التخطيط الأفضل بدلاً من انتظار شخص ما ليأتي وينقذك. سيساعدك هذا على استيعاب الكوارث واستعادة البنية التحتية لتكنولوجيا المعلومات الخاصة بك بكفاءة.
هنا ، الهدف الرئيسي هو الحفاظ على الوظائف والهياكل الأساسية واستعادتها في الوقت المناسب كلما لزم الأمر. لكي تصبح منظمة قادرة على الصمود في وجه الكوارث ، يجب أن تستعد مقدمًا وأن تكون لديك القدرة على توقع المخاطر ، والتكيف مع التغييرات ، والمشاركة والتعلم ، ودمج مختلف القطاعات ، وإدارة مستويات المخاطر.
جيش تحرير السودان

اتفاقية مستوى الخدمة (SLA) هي خطة لمواجهة الكوارث تذكر فيها للمستخدمين النهائيين الوقت الذي قد تستغرقه لاستعادة الخدمات أثناء حالة الطوارئ.
تضمن اتفاقية مستوى الخدمة (SLA) للعملاء أن تكون بياناتهم آمنة ولا يتم اختراقها أو مشاركتها مع جهات خارجية. إنها نقطة الاتصال الوحيدة مع قضايا المستخدم النهائي.
توفر كل بنية تحتية لتكنولوجيا المعلومات ضمانًا بشأن اتفاقية مستوى الخدمة لعملائها. لذا ، تأكد من التواصل مع المستخدمين النهائيين مسبقًا.
SPOF
نقطة الفشل الفردية (SPOF) هي قطعة من المعدات أو فرد أو مورد أو تطبيق تتصل به العديد من الأنظمة أو التطبيقات الأخرى.
في حالة تعطل مثل هذا الجهاز أو المورد ، تنخفض معه جميع الأجزاء الأساسية المتصلة بالنظام. وبالتالي ، ستتأثر العملية برمتها وعملية العمل.
لذلك ، يجب أن يكون لديك استراتيجية للتعامل مع مثل هذه المشكلة للحفاظ على عمل مؤسستك. أول شيء يمكنك القيام به هو تحديد قطعة واحدة من المعدات أو النظام الذي يمكن أن يؤثر بشكل أكبر. بعد ذلك ، قم بإجراء تحليل تأثير الأعمال واحصل على درجة تقييم المخاطر لتكون على دراية بالمشاهد التي ستحدث. حفر في والعثور عليها قبل الحدث.
بمجرد إدراج كل SPOF ، صنفهم وفقًا لعملية الاسترداد. ضع كل فئة من SPOF في ثلاث فئات مختلفة:
- يمكنك الاسترداد بسهولة ومباشرة بأقل وقت وميزانية.
- قد يكون الاسترداد صعبًا ، ولكن يمكن تطوير عملية موثوقة للاستعادة.
- لا يمكن فعل أي شيء للتعافي بمجرد هبوطه.
يمكنك التصرف وفقًا للفئة.
استرجاع النظام
أثناء فشل الأجهزة ، يجب عليك تشغيل عملية استرداد لاسترداد النظام أو الخادم المحدد إلى شكله الأصلي. ولاستعادة النظام بأكمله ، يجب أن تكون جاهزًا مع متطلبات الاسترداد والنسخ الاحتياطية وتوافق البرامج الثابتة وتوافق الأجهزة.
استعادة النظام هي عملية تعيد ضبط الجهاز على إعداداته السابقة أو على نفس الحالة التي كان عليها عندما كان جديدًا. سيؤدي القيام بذلك إلى القضاء على جميع الإصابات بالفيروسات بسبب البرامج أو التطبيقات المثبتة في نظامك.
تتضمن هذه العملية تخطيط استرداد البنية التحتية لتكنولوجيا المعلومات التي تحدد وتتبع إجراءات معينة لضمان توفر البيانات ضد الاضطرابات الطبيعية أو التي من صنع الإنسان.
استعادة النظام
استعادة النظام هي أداة استرداد تتيح لك استعادة بعض الملفات والمعلومات إلى حالتها السابقة في الوقت المناسب.
باستخدام استعادة النظام ، يمكنك استعادة مفاتيح التسجيل والبرامج المثبتة وبرامج التشغيل وملفات النظام والمزيد إلى الإصدار السابق. هذا بمثابة المنقذ في كثير من الكوارث.
خطة اختبار
يشير إلى مستند يخزن معلومات حول استراتيجية الاختبار ، والتقديرات ، والموارد ، والمواعيد النهائية ، والأهداف ، والجداول الزمنية. إنه يعمل كمخطط يقوم بإجراء اختبارات لضمان سلامة الأجهزة والبرامج.
ويشمل ذلك اختبارات مختلفة وفقًا للإجراءات والخطوات المخطط لها لإدارة الآثار اللاحقة للكوارث. قم بإجراء الاختبارات الدورية من أجل إعداد نفسك ومؤسستك لعدم تخطي خطوة واحدة خلال مسار العمل. بهذه الطريقة ، يمكن للبنية التحتية لتكنولوجيا المعلومات فهم أوجه القصور والاستعداد للمعركة.
استنتاج
لا أحد يعرف متى ستحدث كارثة. لذلك ، تعتبر تدابير السلامة والأمن المناسبة ضرورية لكل عمل.
ستساعدك مصطلحات التعافي من الكوارث على فهم كيفية الاستجابة للهجمات والكوارث. سيساعدك أيضًا على الاستعداد مسبقًا حتى تتمكن من حماية البنية التحتية الخاصة بك أثناء حدث غير متوقع. ستكون قادرًا على إنشاء إستراتيجية فعالة في الوقت الفعلي للتعافي من الكوارث لتوفير ملايين الدولارات وحجب ثقة العملاء.