[AZ-500] Azure Synapse Analytics 실전 모의문제 — 05/14

작성자: azure | 작성일: 2026년 05월 14일 | 조회: 5 | 좋아요: 1

🔒

ASSOCIATE LEVEL

Microsoft Azure Security Engineer Associate

AZ-500 | 다중 선택 | 데이터 분석

📝 QUESTION

고객은 Azure Synapse Analytics 전용 SQL 풀(dedicated SQL pool)을 핵심 데이터 웨어하우스로 사용하고 있습니다. Azure Data Factory (ADF) 파이프라인은 온프레미스 OLTP 데이터베이스에서 증분 데이터를 매일 추출하여 `FactSales` 테이블로 로드합니다. 최근 비즈니스 사용자들은 Power BI 보고서에서 보여지는 `FactSales` 데이터가 종종 최신 상태가 아니며, 해당 보고서의 새로 고침 시간이 눈에 띄게 길어졌다고 불평하고 있습니다. ADF 파이프라인의 실행 로그를 확인하면 매일 성공적으로 완료되는 것으로 나타납니다. 하지만 `FactSales` 테이블을 직접 쿼리했을 때, 특정 기간의 데이터가 누락되거나 예상보다 오래된 것으로 확인되었습니다. 이 문제 상황을 진단하고 해결하기 위한 적절한 조치 3가지를 선택하세요.

A. ADF 파이프라인의 복사 활동(Copy Activity) 소스 쿼리(Source Query) 로직을 검토하고, 증분 로드(incremental load)를 위한 워터마크(watermark) 열 또는 조건 필터가 정확하게 최신 데이터를 추출하도록 수정합니다.

B. Azure Synapse Analytics의 `FactSales` 테이블에 대한 통계(statistics)를 수동으로 업데이트하거나 자동 통계 업데이트 설정을 확인합니다.

C. `FactSales` 테이블의 데이터 분산 전략(data distribution strategy)과 인덱스(index) 구성을 검토하여, 대용량 팩트(fact) 테이블에 적합한 클러스터형 Columnstore 인덱스(Clustered Columnstore Index) 사용 여부 및 해시 분산 키(hash distribution key)의 데이터 편향(data skew) 여부를 확인합니다.

D. Azure Synapse Analytics 전용 SQL 풀의 컴퓨팅 노드(Compute Node) 수를 늘리거나 더 높은 성능 계층(Performance Tier)으로 스케일 업(scale up) 합니다.

⬇️ 아래에서 정답과 해설을 확인하세요 ⬇️

✅ ANSWER

정답: A, B, C

✅ A. ADF 파이프라인의 복사 활동(Copy Activity) 소스 쿼리(Source Query) 로직을 검토하고, 증분 로드(incremental load)를 위한 워터마크(watermark) 열 또는 조건 필터가 정확하게 최신 데이터를 추출하도록 수정합니다.

✅ B. Azure Synapse Analytics의 `FactSales` 테이블에 대한 통계(statistics)를 수동으로 업데이트하거나 자동 통계 업데이트 설정을 확인합니다.

✅ C. `FactSales` 테이블의 데이터 분산 전략(data distribution strategy)과 인덱스(index) 구성을 검토하여, 대용량 팩트(fact) 테이블에 적합한 클러스터형 Columnstore 인덱스(Clustered Columnstore Index) 사용 여부 및 해시 분산 키(hash distribution key)의 데이터 편향(data skew) 여부를 확인합니다.

❌ D. Azure Synapse Analytics 전용 SQL 풀의 컴퓨팅 노드(Compute Node) 수를 늘리거나 더 높은 성능 계층(Performance Tier)으로 스케일 업(scale up) 합니다.

📖 EXPLANATION

A. ADF 파이프라인이 성공해도 소스 쿼리 로직이 잘못되면 최신 데이터가 추출되지 않아 데이터가 누락될 수 있습니다. 증분 로드 메커니즘을 정확하게 구현하는 것이 중요합니다.
B. Azure Synapse Analytics의 통계가 오래되면 쿼리 최적화 프로그램이 비효율적인 실행 계획을 생성하여 쿼리 성능이 저하됩니다. 정기적인 통계 업데이트가 필수적입니다.
C. 대용량 팩트 테이블에 클러스터형 Columnstore 인덱스를 사용하면 쿼리 성능이 크게 향상되며, 해시 분산 테이블의 데이터 편향은 특정 노드에 부하를 집중시켜 성능 저하를 유발합니다.
D. 스케일 업은 비용이 많이 들고 근본적인 데이터 구조 또는 로딩 로직 문제를 해결하지 못할 수 있으므로, 먼저 최적화를 시도하는 것이 좋습니다.

💡 핵심 포인트: Azure Synapse Analytics의 전용 SQL 풀 성능 최적화와 Azure Data Factory의 증분 로드(incremental load) 메커니즘 이해

🏷️ 관련 Azure 서비스

Azure Synapse AnalyticsAzure Data Factory

📚 Azure 자격증 준비를 위한 데일리 모의문제

매일 새로운 문제가 업데이트됩니다 | 더 많은 문제 풀기 →