[07/05] AZ-400 Azure Traffic Manager — 이론 완성

작성자: azure | 작성일: 2026년 07월 05일 | 조회: 0 | 좋아요: 0

🔧
EXPERT LEVEL

Microsoft Azure DevOps Engineer Expert (AZ-400)

고가용성 및 재해복구 핵심 이론 강의

🎓 TODAY'S LECTURE

글로벌 비즈니스를 위한 다중 리전 애플리케이션 재해 복구 및 고가용성 아키텍처

Azure Traffic Manager, Azure Site Recovery 및 Region Pair를 활용한 교차 리전 전략

글로벌 시장을 목표로 하는 현대 애플리케이션은 단순한 고가용성을 넘어 지역적 재해에 대한 복원력을 필수로 합니다. 단일 리전 장애는 비즈니스 연속성에 치명적인 영향을 미칠 수 있으므로, Azure는 여러 리전에 걸쳐 애플리케이션과 데이터를 보호하는 강력한 재해 복구 (DR) 및 고가용성 (HA) 전략을 제공합니다. 이 강의에서는 Azure의 핵심 서비스들을 조합하여 무중단에 가까운 서비스를 제공하는 다중 리전 아키텍처를 설계하고 구현하는 방법을 심층적으로 다룹니다.

💡 KEY CONCEPTS

1 Azure Region Pair (Azure 리전 쌍)

Azure의 모든 리전은 동일한 지리적 영역 내에서 다른 리전과 쌍을 이룹니다. 이 리전 쌍은 데이터 상주 요구 사항을 충족하며, 재해 발생 시 동시 업데이트, 물리적 격리 및 순차적 복구를 보장합니다. 한 리전에서 계획된 Azure 유지 관리가 발생하면, 업데이트는 쌍을 이루는 리전 중 하나에만 순차적으로 적용되어 애플리케이션 중단 시간을 최소화합니다. 또한, 리전 쌍은 지리적으로 충분히 떨어져 있어 광범위한 재해로부터 보호하면서도 데이터 복제에 충분히 가까이 위치합니다.

2 Azure Traffic Manager를 활용한 글로벌 트래픽 관리 (Global Traffic Management with Azure Traffic Manager)

Azure Traffic Manager (트래픽 관리자)는 DNS 기반 트래픽 로드 밸런서로, 전 세계 Azure 리전에 분산된 서비스 엔드포인트로 사용자 트래픽을 효율적으로 분산시킵니다. 정의된 라우팅 메서드 (예: 우선순위, 지리적, 성능, 가중치)에 따라 사용자 요청을 최적의 엔드포인트로 보냅니다. 한 리전에서 장애가 발생하면, Traffic Manager는 자동으로 상태 비정상 엔드포인트를 감지하고 트래픽을 정상 작동하는 다른 리전으로 리디렉션하여 애플리케이션의 고가용성을 유지합니다.

3 Azure Site Recovery를 이용한 애플리케이션 복제 및 오케스트레이션 (Application Replication and Orchestration with Azure Site Recovery)

Azure Site Recovery (사이트 복구)는 Azure 가상 머신 (VM), 온프레미스 VM 및 물리적 서버를 Azure 또는 보조 데이터 센터로 복제하고 재해 발생 시 복구를 오케스트레이션하는 서비스입니다. 이를 통해 애플리케이션의 지속적인 복제와 최소한의 RPO (Recovery Point Objective)를 달성하며, 사용자 지정 가능한 복구 계획 (Recovery Plan)을 통해 여러 계층의 애플리케이션을 자동으로 장애 조치 (Failover) 및 장애 복구 (Failback) 할 수 있습니다. ASR은 복구 계획 테스트 기능을 제공하여 실제 재해 발생 전에 계획의 유효성을 검증할 수 있습니다.

🛠️ REAL-WORLD SCENARIO

글로벌 금융 서비스 기업이 미션 크리티컬한 웹 애플리케이션을 Azure에 배포하고자 합니다. 이 애플리케이션은 북미와 유럽 시장에 서비스를 제공하며, 한 리전의 전체 장애에도 불구하고 서비스 중단 없이 운영되어야 합니다.

**아키텍처 구성**:
* **주 리전 (Primary Region)**: 미국 동부 (East US)에 웹/API 계층 (VM Scale Sets), 데이터베이스 (Azure SQL Database with Active Geo-replication), 스토리지 (Storage Account with GRS)를 배포합니다.
* **보조 리전 (Secondary Region)**: 미국 서부 (West US)에 주 리전과 동일한 인프라를 배포하고, 모든 서비스에 대한 DR 복제본을 구성합니다. (미국 동부와 미국 서부는 서로 다른 지리적 영역의 리전 쌍으로 간주될 수 있습니다.)
* **글로벌 트래픽 관리**: Azure Traffic Manager를 사용하여 `Priority` 라우팅 방식으로 구성합니다. 주 리전을 우선순위 1로, 보조 리전을 우선순위 2로 설정합니다. Traffic Manager는 주 리전 엔드포인트의 상태를 지속적으로 모니터링합니다.
* **데이터베이스 복제**: Azure SQL Database의 활성 지역 복제 (Active Geo-replication) 기능을 사용하여 주 리전과 보조 리전 간에 거의 실시간으로 데이터를 동기화합니다.
* **VM/애플리케이션 계층 DR**: Azure Site Recovery를 사용하여 주 리전의 VM Scale Set 인스턴스 (또는 VM)를 보조 리전으로 지속적으로 복제합니다. 사용자 지정 복구 계획을 구성하여 웹/API 계층 VM의 장애 조치 순서를 정의합니다.
* **스토리지 복제**: Azure Storage Account는 기본적으로 GRS (Geo-Redundant Storage)를 사용하여 쌍을 이루는 리전으로 데이터를 복제합니다. 이를 통해 오브젝트 및 파일 스토리지의 재해 복원력을 확보합니다.

**작동 방식**:
정상 작동 시, Traffic Manager는 모든 트래픽을 미국 동부 (주 리전)로 라우팅합니다. 만약 미국 동부 리전에 광범위한 장애가 발생하여 Traffic Manager가 주 리전 엔드포인트를 비정상으로 감지하면, 자동으로 트래픽을 미국 서부 (보조 리전)로 리디렉션합니다. 동시에, Azure Site Recovery 복구 계획이 자동 또는 수동으로 트리거되어 보조 리전의 VM들을 활성화하고, Azure SQL Database는 보조 복제본을 주 복제본으로 승격하여 애플리케이션의 운영을 인계받습니다. 이 과정을 통해 최소한의 RTO (Recovery Time Objective)와 RPO를 달성하며 비즈니스 연속성을 유지합니다.

**모범 사례 (Best Practice)**:
1. **정기적인 DR 테스트**: Azure Site Recovery의 테스트 장애 조치 (Test Failover) 기능을 사용하여 실제 프로덕션 환경에 영향을 주지 않고 복구 계획을 정기적으로 테스트하여 계획의 유효성을 검증하고 RTO를 측정합니다.
2. **자동화된 배포 및 구성**: Azure DevOps 파이프라인과 Infrastructure as Code (ARM 템플릿, Bicep, Terraform)를 사용하여 주 리전과 보조 리전의 인프라를 일관되게 배포하고 관리하여 DR 환경의 동기화를 유지합니다.
3. **애플리케이션 상태 모니터링**: Azure Monitor 및 Application Insights를 사용하여 애플리케이션의 성능과 상태를 지속적으로 모니터링하고, Traffic Manager의 엔드포인트 모니터링 외에 애플리케이션 수준의 상태 점검을 구현합니다.
4. **RTO/RPO 목표 설정**: 비즈니스 요구사항에 맞춰 현실적인 복구 시간 목표 (RTO) 및 복구 지점 목표 (RPO)를 설정하고, 선택된 HA/DR 서비스가 이러한 목표를 충족하는지 확인합니다.

🎯 EXAM TIPS
📌

Traffic Manager 라우팅 메서드와 사용 사례: Priority, Performance, Geographic, Weighted 라우팅 메서드 각각의 특징과 어떤 시나리오에서 가장 적합한지 비교 분석하는 문제가 자주 출제됩니다. (예: 다중 리전 DR에는 주로 Priority 사용)

📌

Azure Site Recovery와 Azure Backup의 차이점: ASR은 재해 복구를 위한 애플리케이션 복제 및 오케스트레이션에 중점을 두며 낮은 RTO/RPO를 목표로 하는 반면, Azure Backup은 데이터 보존 및 복원에 중점을 둡니다. 두 서비스의 목적과 활용 범위의 명확한 구분이 중요합니다.

📌

Region Pair의 이점 및 고려사항: 리전 쌍이 제공하는 데이터 상주 보장, 순차적 업데이트, 물리적 격리 등의 이점을 이해하고, 모든 Azure 서비스가 리전 쌍 복제를 자동으로 활용하는 것은 아니므로 각 서비스의 DR 기능을 개별적으로 구성해야 함을 인지해야 합니다. (예: VM은 ASR, SQL DB는 Geo-replication)

🏷️ 관련 Azure 서비스

Azure Traffic ManagerAzure Site RecoveryAzure SQL Database Active Geo-replicationAzure Storage (Geo-Redundant Storage)Azure Virtual Machines (VMs)Azure Virtual Machine Scale Sets

📚 Azure 자격증 합격을 위한 데일리 이론 강의

매일 새로운 강의 노트가 업데이트됩니다 | 더 많은 자료 보기 →