[MLS-C01] AWS 오늘의 퀴즈 (복수 정답)

작성자: aws | 작성일: 2026년 05월 15일 | 조회: 2 | 좋아요: 0

AWS MLS-C01 | Specialty

🤖 Machine Learning – Specialty

Q. 한 금융 기업이 고객의 거래 패턴을 분석하여 이상 탐지 (Anomaly Detection) 모델을 구축하고 있습니다. 이 모델은 실시간으로 대량의 거래 데이터를 수집하고, 빠르게 특징 (features)을 추출하며, 모델 추론 (inference)을 위해 매우 낮은 지연 시간 (low latency)으로 특징 저장소 (feature store)에서 데이터를 조회해야 합니다. 또한, 수집된 데이터를 기반으로 주간 배치 학습 (batch training)을 수행해야 하며, 데이터는 페타바이트 (petabyte) 규모로 증가할 것으로 예상됩니다. 비용 효율성, 고가용성, 그리고 미래 확장을 모두 고려해야 합니다. 이러한 요구사항을 가장 효율적이고 비용 효과적으로 충족시키기 위한 데이터베이스 솔루션으로 가장 적합한 두 가지는 무엇입니까?

A. 실시간 특징 저장소 및 고처리량 데이터 수집을 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Redshift를 사용합니다.

B. 모든 데이터 저장 및 실시간 특징 조회를 위해 Amazon Aurora PostgreSQL 호환 에디션을 사용하고, Read Replica를 통해 읽기 용량을 확장합니다.

C. 실시간 특징 저장소 및 캐싱을 위해 Amazon ElastiCache (Redis)를 사용하고, 배치 학습 데이터 저장을 위해 Amazon S3에 Parquet 파일로 저장합니다.

D. 실시간 특징 저장소를 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Neptune을 사용합니다.

E. 실시간 특징 저장소 및 고처리량 데이터 수집을 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Redshift Serverless를 사용합니다.

🎯 정답: A, E

✅ A. 실시간 특징 저장소 및 고처리량 데이터 수집을 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Redshift를 사용합니다.

B. 모든 데이터 저장 및 실시간 특징 조회를 위해 Amazon Aurora PostgreSQL 호환 에디션을 사용하고, Read Replica를 통해 읽기 용량을 확장합니다.

C. 실시간 특징 저장소 및 캐싱을 위해 Amazon ElastiCache (Redis)를 사용하고, 배치 학습 데이터 저장을 위해 Amazon S3에 Parquet 파일로 저장합니다.

D. 실시간 특징 저장소를 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Neptune을 사용합니다.

✅ E. 실시간 특징 저장소 및 고처리량 데이터 수집을 위해 Amazon DynamoDB를 사용하고, 배치 학습 데이터 저장을 위해 Amazon Redshift Serverless를 사용합니다.

💡 해설:
이 시나리오의 핵심 요구사항은 '실시간 저지연 특징 저장소', '페타바이트 규모의 배치 학습 데이터 저장 및 분석', '고처리량 데이터 수집', '비용 효율성 및 고가용성'입니다.

**A와 E가 정답인 이유:**
* **Amazon DynamoDB:** 매우 낮은 지연 시간으로 예측 가능한 성능을 제공하는 NoSQL 데이터베이스입니다. 실시간 특징 저장소 (feature store)로 적합하며, 높은 처리량으로 거래 데이터를 수집하는 데 이상적입니다.
* **Amazon Redshift / Amazon Redshift Serverless:** 페타바이트 규모의 분석 데이터를 저장하고 복잡한 쿼리를 빠르게 실행하는 데 최적화된 데이터 웨어하우스입니다. 주간 배치 학습을 위한 대규모 데이터셋을 효율적으로 처리할 수 있습니다. 특히 Redshift Serverless는 용량 계획 없이 온디맨드로 확장되며 사용한 만큼만 비용을 지불하므로 비용 효율성과 관리 용이성 측면에서 매우 유리합니다.

**나머지 보기가 적합하지 않은 이유:**
* **B. Amazon Aurora PostgreSQL:** 관계형 데이터베이스로, 페타바이트 규모의 분석 작업에는 Redshift보다 비효율적이며, 실시간 특징 저장소의 극도로 낮은 지연 시간 및 고처리량 요구사항을 DynamoDB만큼 충족시키기 어렵습니다.
* **C. Amazon ElastiCache (Redis):** 캐싱 계층으로 매우 낮은 지연 시간을 제공하지만, 모든 특징 데이터를 저장하는 주 스토리지로는 적합하지 않으며, 배치 학습을 위한 구조화된 대규모 데이터 웨어하우스 기능을 제공하지 않습니다. Amazon S3는 원시 데이터 저장에는 좋지만, 직접적인 분석 쿼리 성능은 Redshift에 비해 떨어집니다.
* **D. Amazon Neptune:** 그래프 데이터베이스로, 주로 관계 기반의 데이터 모델에 사용됩니다. 거래 패턴에서 '이상 탐지'의 특징 저장소나 대규모 배치 분석용으로는 적합하지 않습니다.

🚀 Tip: MLS-C01 시험에서는 머신러닝 워크로드의 데이터 요구사항 (실시간 처리, 대규모 분석, 특징 저장소 등)에 따라 어떤 AWS 데이터베이스 서비스가 가장 적합한지 판단하는 능력을 중요하게 평가합니다. 각 서비스의 강점과 약점, 그리고 특정 사용 사례에 대한 적합성을 명확히 이해해야 합니다. 특히, ML 파이프라인에서 데이터 저장소의 역할(훈련 데이터, 특징 저장소, 모델 출력 저장 등)을 구분하여 솔루션을 선택하는 연습이 중요합니다.

Amazon DynamoDBAmazon RedshiftAmazon Redshift ServerlessAmazon Aurora PostgreSQLAmazon ElastiCache (Redis)Amazon NeptuneAmazon S3

🛡️ Deuktem AWS Quiz Bot | 커뮤니티 이동