RTO 대 RPO: 복구 목표가 IT 성공에 중요한 이유
게시 됨: 2021-01-25기업은 IT 가동 중지 시간에 더 많은 비용이 든다는 사실을 알고 있습니다.
기업은 다운타임의 의미를 고려하고 비즈니스 운영의 연속성을 유지하는 데 집중해야 합니다. 이를 위해서는 다운타임을 최소화하거나 완전히 피할 수 있도록 적절한 비즈니스 연속성 계획을 구현해야 합니다. 이러한 방식으로 기업은 IT 인프라의 복원력을 보장할 수 있습니다.
비즈니스 다운타임에 대해 논의할 때 RTO(복구 시간 목표) 및 RPO(복구 시점 목표)에 대해 자주 듣게 됩니다. 모든 비즈니스는 재해로부터 신속한 복구를 보장하기 위해 RTO 및 RPO를 완전히 이해하는 것이 중요합니다.
RTO 및 RPO를 측정하는 방법, 백업 비즈니스 연속성 계획에서 이러한 메트릭의 역할, 비즈니스의 RTO 및 RPO 목표를 정의하고 달성하는 방법에 대해 논의할 것입니다.
RTO(복구 시간 목표)란 무엇입니까?
RTO(복구 시간 목표) 는 비즈니스 운영에 큰 영향을 미치지 않도록 다운타임 후 시스템 또는 애플리케이션을 얼마나 빨리 복구해야 하는지 계산하는 데 도움이 되는 핵심 메트릭입니다. 간단히 말해서, RTO는 얼마나 많은 가동 중지 시간을 견딜 수 있는지를 측정한 것입니다.
예기치 않은 중단이 발생하면 하나 또는 두 개의 시스템이 실패할 수 있으며 이 문제가 해결될 때까지 가동 중지 시간에 직면하게 됩니다. 이로 인해 비즈니스 운영이 중단되지 않도록 시스템을 복원해야 하는 시간을 결정해야 하는 상황에 놓이게 됩니다. 여기서 RTO가 등장합니다.
RTO를 정의하려면 각 시스템의 허용 중단 시간을 이해해야 하며 애플리케이션마다 RTO가 다를 수 있습니다. RTO 메트릭을 정의하면 다운타임에서 성공적이고 신속한 복원을 위해 필요한 복구 전략 및 기술을 포함하는 복구 계획을 세울 수 있습니다.
RPO(복구 시점 목표)란 무엇입니까?
RPO(복구 시점 목표) 는 비즈니스가 견딜 수 있고 비즈니스 운영에 영향을 미치지 않고 계속 작동할 수 있는 데이터 손실의 양에 대해 설정한 메트릭입니다.
RPO를 결정하려면 데이터의 중요도를 평가하여 데이터 전체 또는 일부를 복구해야 하는지 여부를 파악해야 하며 상대적으로 덜 중요하고 복원할 필요가 없는 데이터도 있을 수 있습니다. 이를 기반으로 시스템에 대한 RPO를 정의할 수 있습니다. 데이터의 중요도가 높을수록 RPO의 가치는 낮아야 합니다.
RPO 결정은 중요도에 따라 데이터를 백업할 빈도를 설정하는 데 도움이 되므로 백업 계획의 필수 부분입니다.
RTO와 RPO의 차이점
RTO 및 RPO는 백업 및 재해 복구 계획과 관련된 중요한 요소입니다. RTO와 RPO는 모두 시간 단위로 정의되고 측정됩니다. RTO와 RPO는 비슷하게 들리지만 몇 가지 중요한 차이점이 있습니다.
복구 시간 목표(RTO) | RPO(복구 시점 목표) |
복구할 때까지 견딜 수 있는 가동 중지 시간과 관련됨 | 허용 가능한 데이터 손실 관련 |
복원에 걸리는 시간과 관련 | 백업 빈도 관련 |
최신 데이터로 정상 복원 관련 | 복구된 데이터가 얼마나 최신 상태인지 관련 |
전체 시스템 또는 애플리케이션 또는 보다 세분화된 수준의 복원을 포함하여 목표를 달성하는 데 필요한 복구 기술에 중점을 둡니다. | 적절한 간격으로 시스템의 백업을 자동화하는 데 중점을 둡니다. |
RTO 및 RPO를 사용하여 비즈니스 다운타임 최소화
IT 다운타임은 시스템 충돌, 네트워크 또는 애플리케이션 장애, 랜섬웨어 공격으로 인한 데이터 손실, 자연재해로 인한 사이트 재해 등 여러 가지 이유로 발생합니다. 앞서 언급한 예상치 못한 상황이 발생하면 비즈니스 운영이 중단되고 비용이 더 많이 들 수 있습니다.
애플리케이션은 중요하며 항상 사용할 수 있어야 합니다. 비즈니스의 중요한 애플리케이션에 장애가 발생하면 애플리케이션 서비스가 중단되고 데이터 손실이 발생합니다. 이는 장단기적으로 비즈니스 운영에 직접적인 영향을 미치며 생산성, 수익 및 브랜드에 영향을 미칩니다. 어떤 극단적인 경우에는 회사가 문을 닫게 만들 수도 있습니다.
애플리케이션의 허용 중단 시간은 비즈니스에 따라 다를 수 있지만 여기서 중요한 요소는 애플리케이션의 가용성을 신속하게 복원하여 중단 시간을 줄이는 것입니다.
적시에 시스템을 가동하고 실행하려면 모든 기업이 확실한 데이터 보호 전략, 즉 백업 및 재해 복구 계획을 세워야 합니다. 비즈니스를 위한 백업 및 재해 복구 계획을 선택할 때 더 짧은 RTO 및 RPO를 제공하는 솔루션을 찾아야 합니다. 이를 통해 가동 중지 시간을 최소화하고 필요할 때 시스템을 복원하여 비즈니스 연속성을 보장할 수 있습니다.
RTO 및 RPO 메트릭 무시의 위험
RTO 및 RPO 메트릭을 올바르게 평가하고 정의하면 다운타임과 관련된 위험을 최소화하는 데 도움이 됩니다. 이러한 메트릭은 비즈니스 복구 목표 및 SLA(서비스 수준 계약) 관리와 일치해야 합니다.
RTO 및 RPO를 적절하게 정의하지 않으면 덜 위험한 수준에서 심각한 수준까지 모든 수준의 위험이 발생할 수 있습니다. 또한 필요한 시점에서 데이터를 복원할 수 없으므로 데이터가 손실되고 비즈니스 운영이 중단될 수 있습니다. 게다가 필요한 시간 내에 시스템을 가동할 수 없습니다. 필요할 때 중요한 시스템을 사용할 수 없는 경우 비즈니스 운영이 중단될 수 있습니다.

위에서 언급한 두 경우 모두 비즈니스 운영이 중단되면 생산성이 저하될 수 있습니다. 최악의 경우 수익 손실이 발생하고 비즈니스 평판의 손실과 같은 심각한 결과를 초래할 수 있습니다.
백업 및 재해 복구 계획으로 RTO 및 RPO를 달성하는 방법
보고 있는 모든 백업 및 재해 복구 솔루션은 SLA에 보장된 RPO 및 RTO를 지정합니다. 선택한 백업 및 재해 복구 솔루션이 비즈니스 복구 목표인 RTO 및 RPO를 보장하는지 항상 확인하십시오.
백업 및 재해 복구 솔루션은 비즈니스 RTO 및 RPO 목표를 달성하기 위한 다양한 기능을 제공합니다. 비즈니스가 RTO 및 RPO를 거의 0에 가깝게 달성하는 데 도움이 되는 백업 및 재해 복구 솔루션에서 찾아야 하는 몇 가지 중요한 기능을 살펴보겠습니다.
유연한 일정 정책
오늘날의 백업 및 재해 복구 솔루션은 유연한 스케줄링 정책을 제공하여 애플리케이션에 대한 RPO를 정의합니다. 일정 정책을 사용하면 몇 분마다, 몇 시간마다 또는 하루에 한 번과 같은 정기적인 간격으로 자동 백업을 실행할 수 있습니다. 이렇게 하면 RPO를 훨씬 쉽게 구현할 수 있습니다.
CDP(지속적 데이터 보호) 는 시스템/애플리케이션이 변경될 때마다 즉시 백업 또는 복제되도록 합니다. 이렇게 하면 두 개의 예약된 백업 간에 생성된 데이터가 손실될 위험이 있는 기업의 문제를 해결하고 RPO를 0으로 만들 수 있습니다. 그러나 중요한 워크로드에 대해 CDP를 활성화하면 더 많은 리소스를 사용하므로 성능 또는 안정성 문제가 발생할 수 있습니다. 이러한 이유로 CDP는 파일 수준 백업에 널리 사용됩니다.
거의 연속 데이터 보호 는 거의 0으로 설정하고 정기적으로 실행할 수 있습니다. 이는 CDP의 효과에 가깝고 스냅샷 기반 기술 등을 사용하는 이미지 수준의 백업/복제를 수행하는 데 사용할 수 있습니다. 시중에 나와 있는 대부분의 백업 및 재해 복구 솔루션을 사용하면 중요한 시스템에 대해 15분 미만의 거의 0에 가까운 RPO를 달성할 수 있습니다.
즉각적인 복구 기능
귀하의 비즈니스에는 즉각적인 복구를 통해 달성할 수 있는 거의 0에 가까운 RTO 목표를 달성할 수 있는 옵션이 필요합니다.
모든 비즈니스가 백업 및 재해 복구 계획의 일부로 필요로 하는 즉각적인 복구 기능 중 하나는 백업 스토리지에서 백업된 머신을 비즈니스 운영을 계속할 준비 상태의 가상 머신으로 즉시 부팅하는 기능입니다.
백업 스토리지에 암호화되고 압축된 형식으로 남아 있는 백업 데이터를 사용하여 최신 백업 또는 특정 시점에서 가상 환경의 머신을 즉시 시작할 수 있습니다. 이제 몇 분 안에 중요한 시스템을 가동하고 실행할 수 있으며 거의 0에 가까운 RTO를 충족하면서 비즈니스 연속성을 보장할 수 있습니다.
이를 통해 가동 중지 시간을 최소화할 수 있으며 모든 Tier 1 미션 크리티컬 시스템은 비즈니스에 영향을 주지 않고 계속 작동합니다. 나중에 영구 복구를 위해 즉시 부팅된 가상 머신을 프로덕션으로 마이그레이션할 수 있습니다.
세분화된 복구
백업 및 재해 복구 계획에서 세분화된 복구 의 역할은 중요한 역할을 합니다. 필요한 데이터만 복원할 수 있는 기능을 제공합니다.
이 옵션을 사용하면 백업에서 직접 파일 또는 응용 프로그램 항목을 선택적으로 복원할 수 있습니다. 실수로 파일을 삭제한 경우 해당 특정 파일을 쉽게 선택하고 복원할 수 있습니다. 또한 전체 데이터베이스나 애플리케이션을 복구할 필요 없이 특정 메일이나 메일함을 즉시 복구할 수 있습니다. 이제 몇 분의 RTO를 달성할 수 있습니다. 개별 항목을 복구하기 위해 매번 전체 시스템을 복원할 필요가 없으므로 시간과 리소스가 절약됩니다.
장애 조치를 통한 라이브 복제
라이브 복제 를 사용하면 프로덕션 워크로드의 정확한 복사본을 다른 사이트에 생성하고 거의 0에 가까운 RPO를 구성하는 복제본 시스템에 변경 사항을 자주 복제할 수 있습니다.
가동 중단이나 손상으로 인해 원본 머신을 사용할 수 없게 되면 프로덕션 작업을 복제본 머신으로 원활하게 전환하는 장애 조치(failover) 작업을 즉시 수행할 수 있습니다. 가동 중지 시간이나 영향 없이 거의 0에 가까운 RTO 목표를 달성하면서 비즈니스 운영을 계속할 수 있습니다. RTO와 RPO가 모두 0에 가까운 경우 복제 및 장애 조치 기능을 활용하고 프로덕션 워크로드를 항상 사용 가능한 상태로 유지할 수 있습니다.
재해 복구를 위한 오프사이트 복제본
아무도 재난을 예측할 수 없습니다. 전체 사이트 오류가 발생하면 로컬 백업에도 액세스할 수 없게 되어 데이터를 복구할 수 없는 상태에서 비즈니스가 위험에 처하게 됩니다.
이러한 이유로 백업 사본을 추가로 생성하여 로컬 데이터 센터나 공용 클라우드가 될 수 있는 원격 위치에 저장할 수 있는 재해 복구 계획을 세우는 것이 좋습니다. 오프사이트 백업을 사용하면 재해 발생 시 시스템을 복구하고 비즈니스 복구 목표를 쉽게 달성할 수 있습니다.
결론
백업 및 재해 복구 계획은 재해 시나리오를 처리하는 전체 프로세스에서 매우 중요한 부분입니다. 위에서 설명한 것처럼 재해 발생 시 작업 연속성을 보장하는 주요 측면 중 하나는 백업 및 재해 복구 계획에서 RTO 및 RPO 메트릭을 올바르게 지정하는 것입니다.
RTO 및 RPO 값을 결정하고, 비즈니스 SLA를 충족하는 솔루션을 구현하고, 비즈니스를 항상 가용성으로 유지하십시오.