Amazon AWS Certified Data Engineer - Associate (DEA-C01) (Data-Engineer-Associate Korean Version) - Data-Engineer-Associate Korean FREE EXAM DUMPS QUESTIONS & ANSWERS]

Question 1

한 회사가 온프레미스 서버의 로그 파일을 Amazon S3 버킷에 업로드하고 있습니다. 이 회사는 온프레미스 서버의 로그와 S3 버킷에 저장된 로그가 동일한지 검증해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?

A. AWS SDK를 사용하여 업로드 중에 CRC32 체크섬을 자동으로 계산합니다. 계산된 체크섬은 S3 객체 메타데이터에 저장됩니다. B. 객체를 S3 버킷에 업로드한 후, S3 객체에 대해 거버넌스 모드에서 S3 객체 잠금을 활성화하십시오. C. SHA-256 체크섬을 계산하는 AWS Lambda 함수를 생성합니다. 결과를 별도의 메타데이터 테이블에 저장합니다. 업로드 후 로그를 검증합니다. D. S3 버킷에서 규정 준수 모드로 S3 객체 잠금을 활성화합니다. 객체를 버킷에 업로드합니다.

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 2

한 회사에서 Amazon RDS for MySQL 데이터베이스에 대한 로그를 수집하고 감사를 위해 제공해야 합니다. 로그는 데이터베이스의 데이터를 수정하거나 데이터베이스 인스턴스를 변경하는 각 사용자를 추적해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

A. 기본 Amazon RDS 데이터베이스 감사 로깅을 활성화하고 구성합니다. Amazon CloudWatch Logs를 활성화합니다.
메트릭 필터 및 경보를 구성합니다. AWS CloudTrail 감사 로깅을 구성합니다. B. API 호출을 로깅하도록 AWS CloudTrail을 구성하세요. 기본 모니터링에는 Amazon CloudWatch Logs를 사용하세요. IAM 정책을 사용하여 로그에 대한 액세스를 제어하세요. 로그 감사를 위한 예약 보고를 설정하세요. C. 데이터베이스 활동을 모니터링하는 Amazon EventBridge 규칙을 구성합니다. EventBridge 이벤트를 처리하고 Amazon OpenSearch Service에 저장하는 AWS Lambda 함수를 생성합니다. D. Amazon CloudWatch Logs를 활성화합니다. 데이터베이스 변경 사항 및 인스턴스 수준 변경 사항을 모니터링하는 메트릭 필터를 생성합니다. 의심스러운 데이터베이스 작업에 대해 거의 실시간으로 알림을 전송하는 자동 알림 시스템을 구성합니다.

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 3

한 회사는 Apache Spark 작업을 실행하는 프로비저닝된 Amazon EMR 클러스터를 사용하여 빅 데이터 분석을 수행할 계획입니다. 회사는 높은 신뢰성을 요구합니다. 빅 데이터 팀은 Amazon EMR에서 비용 최적화된 장기 실행 워크로드를 실행하기 위한 모범 사례를 따라야 합니다. 팀은 회사의 현재 성과 수준을 유지할 수 있는 솔루션을 찾아야 합니다.
이러한 요구 사항을 가장 비용 효율적으로 충족할 수 있는 리소스 조합은 무엇입니까? (2개를 선택하세요.)

A. HDFS(Hadoop 분산 파일 시스템)를 영구 데이터 저장소로 사용합니다. B. 코어 노드 및 작업 노드에 Graviton 인스턴스를 사용합니다. C. 코어 노드 및 작업 노드에 x86 기반 인스턴스를 사용합니다. D. Amazon S3를 영구 데이터 저장소로 사용합니다. E. 모든 기본 노드에 스팟 인스턴스를 사용합니다.

Discussion 0

Correct Answer: B,D Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 4

데이터 엔지니어가 데이터 처리 작업을 수행하기 위해 Amazon Athena에 있는 기존 테이블의 빈 복사본을 생성해야 합니다. Athena의 기존 테이블에는 1,000개의 행이 있습니다.
어떤 쿼리가 이 요구 사항을 충족할까요?

A. 데이터 없이 new_table을 SELECT * FROM old_table로 생성합니다. B. 기존 테이블에서 SELECT *를 사용하여 새 테이블을 만듭니다. C. 1=1인 기존 테이블에서 새 테이블을 SELECT *로 생성합니다. D. old_table과 같은 new_table을 생성합니다.

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 5

회사에는 Amazon S3 버킷에 저장된 데이터 세트를 사용하는 여러 애플리케이션이 있습니다. 회사에는 개인 식별 정보(PII)가 포함된 데이터 세트를 생성하는 전자 상거래 애플리케이션이 있습니다.
회사에는 PII에 액세스할 필요가 없는 내부 분석 애플리케이션이 있습니다.
규정을 준수하기 위해 회사는 PII를 불필요하게 공유해서는 안 됩니다. 데이터 엔지니어는 데이터 세트에 액세스하는 각 애플리케이션의 요구 사항에 따라 PII를 동적으로 수정하는 솔루션을 구현해야 합니다.
최소한의 운영 오버헤드로 요구 사항을 충족하는 솔루션은 무엇입니까?

A. AWS Glue를 사용하여 각 애플리케이션의 데이터를 변환합니다. 데이터세트의 복사본을 여러 개 만듭니다. 각 데이터 세트 복사본에 복사본에 액세스하는 애플리케이션의 요구 사항에 맞는 적절한 수준의 수정을 제공합니다. B. S3 객체 Lambda 엔드포인트를 생성합니다. S3 객체 Lambda 엔드포인트를 사용하여 S3 버킷에서 데이터를 읽습니다. S3 객체 Lambda 함수 내에서 수정 논리를 구현하여 데이터에 액세스하는 각 애플리케이션의 요구 사항에 따라 PII를 동적으로 수정합니다. C. S3 버킷 정책을 생성하여 각 애플리케이션의 액세스를 제한합니다. 데이터세트의 복사본을 여러 개 만듭니다.
각 데이터 세트 복사본에 복사본에 액세스하는 애플리케이션의 요구 사항에 맞는 적절한 수준의 수정을 제공합니다. D. 사용자 지정 권한 부여자가 있는 API 게이트웨이 엔드포인트를 생성합니다. API 게이트웨이 엔드포인트를 사용하여 S3 버킷에서 데이터를 읽습니다. 데이터에 액세스하는 각 애플리케이션의 요구 사항에 따라 PII를 동적으로 수정하는 REST API 호출을 시작합니다.

Discussion 0

Correct Answer: B Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 6

어떤 회사에는 개인 식별 정보(PIT) 데이터와 비 PII 데이터가 포함된 JSON 파일이 있습니다.
회사는 쿼리 및 분석을 위해 데이터를 제공해야 합니다. 개인 식별 정보가 아닌 데이터는 회사 내 모든 사람이 이용할 수 있어야 합니다. 개인 식별 정보는 제한된 직원 그룹에게만 제공되어야 합니다. 운영 오버헤드를 최소화하면서 이러한 요구 사항을 충족하는 솔루션은 무엇일까요?

A. JSON 파일을 Amazon S3 버킷에 저장합니다. AWS Glue를 구성하여 파일을 PII 데이터가 포함된 파일 하나와 PII가 아닌 데이터가 포함된 파일 하나로 분할합니다. 출력 파일은 별도의 S3 버킷에 저장합니다. 사용자 유형에 따라 버킷에 필요한 액세스 권한을 부여합니다. B. Amazon RDS PostgreSQL 데이터베이스 두 개를 생성합니다. PII 데이터와 비PII 데이터를 각 데이터베이스에 로드합니다. 사용자 유형에 따라 데이터베이스에 대한 접근 권한을 부여합니다. C. JSON 파일을 Amazon S3 버킷에 저장합니다. AWS Lake Formation에서 파일 스키마를 카탈로그화합니다. Lake Formation 권한을 사용하여 사용자 유형에 따라 필요한 데이터에 대한 액세스를 제공합니다. D. JSON 파일을 Amazon S3 버킷에 저장합니다. Amazon Macie를 사용하여 PII 데이터를 식별하고 사용자 유형에 따라 액세스 권한을 부여합니다.

Discussion 0

Correct Answer: C Vote an answer

Question 7

A. DriverID를 파티션 키로, RideStatus를 정렬 키로 사용하는 전역 보조 인덱스(GSI)를 생성합니다. B. RiderID를 파티션 키로, RideStatus를 정렬 키로 사용하는 전역 보조 인덱스(GSI)를 생성합니다. C. RiderID와 RideStatus를 사용하는 필터 표현식을 생성합니다. D. DriverID에 로컬 보조 인덱스(LSI)를 생성합니다.

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 8

한 회사가 Amazon Redshift를 데이터 웨어하우스로 사용합니다. 데이터 인코딩은 데이터 웨어하우스의 기존 테이블에 적용됩니다. 데이터 엔지니어는 일부 테이블에 적용된 압축 인코딩이 데이터에 가장 적합하지 않다는 것을 발견합니다.
데이터 엔지니어는 최적이 아닌 인코딩이 있는 테이블의 데이터 인코딩을 개선해야 합니다.
어떤 솔루션이 이 요구 사항을 충족시킬까요?

A. 식별된 테이블에 대해 VACUUM REINDEX 명령을 실행합니다. B. 식별된 테이블에 대해 ANALYZE 명령을 실행합니다. 명령의 출력을 기반으로 열의 압축 인코딩을 수동으로 업데이트합니다. C. 식별된 테이블에 대해 VACUUM RECLUSTER 명령을 실행합니다. D. 식별된 테이블에 대해 ANALYZE COMPRESSION 명령을 실행합니다. 명령의 출력을 기반으로 열의 압축 인코딩을 수동으로 업데이트합니다.

Discussion 0

Correct Answer: D Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 9

한 회사는 분기마다 데이터 레이크의 데이터를 분석하여 재고 평가를 수행합니다. 데이터 엔지니어는 AWS Glue DataBrew를 사용하여 데이터 내에서 고객에 대한 개인 식별 정보(PII)를 감지합니다.
회사의 개인정보 보호정책은 일부 사용자 지정 정보 범주를 PII로 간주합니다. 그러나 이러한 범주는 표준 DataBrew 데이터 품질 규칙에 포함되지 않습니다.
데이터 엔지니어는 데이터 레이크 내의 여러 데이터 세트에서 사용자 정의 PII 범주를 스캔하기 위해 현재 프로세스를 수정해야 합니다.
어떤 솔루션이 운영 비용을 최소화하면서 이러한 요구 사항을 충족할 수 있을까요?

A. Data Brew에서 사용자 정의 데이터 품질 규칙을 구현합니다. 데이터 세트 전체에 사용자 정의 규칙을 적용합니다. B. 추출, 변환 및 데이터 레이크로의 로드(ETL) 작업 중에 필드에서 PII 정보를 추출하기 위해 정규식 패턴을 구현합니다. C. 사용자 정의 PII 범주에 대한 데이터를 수동으로 검토합니다. D. 사용자 정의 PII 범주를 감지하기 위한 사용자 정의 Python 스크립트를 개발합니다. DataBrew에서 스크립트를 호출합니다.

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 10

한 회사에 Sales라는 이름의 테이블이 포함된 데이터 웨어하우스가 있습니다. 이 회사는 Amazon Redshift에 테이블을 저장합니다. 이 테이블에는 city_name이라는 이름의 열이 있습니다. 이 회사는 "San" 또는 "El"로 시작하는 city_name이 있는 모든 행을 찾기 위해 테이블을 쿼리하려고 합니다. 이 요구 사항을 충족하는 SQL 쿼리는 무엇입니까?

A. Select * from Sales where city_name -, ^(San|EI) *'; B. Select * from Sales where city_name -, ^(San&EI)"; C. Select * from Sales where city_name - '$(San&EI)"; D. Select * from Sales where city_name - '$(San|EI)";

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 11

데이터 엔지니어는 AWS Glue 대화형 세션을 사용하여 기계 학습(ML) 모델용 데이터를 준비하도록 Amazon SageMaker Studio를 구성하고 있습니다.
데이터 엔지니어가 SageMaker Studio를 사용하여 데이터를 준비하려고 하면 액세스 거부 오류가 발생합니다.
SageMaker Studio에 액세스하려면 엔지니어가 어떤 변경을 해야 합니까?

A. 신뢰 정책에서 AWS Glue 및 SageMaker 서비스 주체에 대한 sts:AddAssociation 작업을 허용하는 정책을 데이터 엔지니어의 IAM 사용자에게 추가합니다. B. 데이터 엔지니어의 IAM 사용자에게 AWSGlueServiceRole 관리형 정책을 추가합니다. C. 신뢰 정책의 AWS Glue 및 SageMaker 서비스 주체에 대한 sts:AssumeRole 작업을 포함하는 데이터 엔지니어의 IAM 사용자에게 정책을 추가합니다. D. 데이터 엔지니어의 IAM 사용자에게 AmazonSageMakerFullAccess 관리형 정책을 추가합니다.

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 12

한 회사가 고빈도 센서 원격 측정 데이터를 아마존 S3 데이터 레이크에 집계합니다. 각 센서 스트림은 매시간 구조화된 레코드를 전송합니다. 이 레코드에는 센서 범주, 장치 ID, 작동 상태, 이벤트 타임스탬프, 사이트 위치와 같은 메타데이터가 포함됩니다. 데이터는 매일 수백만 건의 레코드로 증가합니다. 이 회사는 센서 범주별 성능 관련 인사이트를 도출하기 위해 매일 복잡한 쿼리를 실행합니다.
어떤 솔루션이 이러한 요구 사항을 충족하면서 가장 빠른 쿼리 실행 시간을 제공할까요?

A. 데이터를 CSV 형식으로 저장합니다. 날짜별로 데이터를 분할합니다. 운영 상태별로 데이터를 정렬합니다. B. 데이터를 CSV 형식으로 저장합니다. 날짜별로 데이터를 분할합니다. 센서 범주별로 데이터를 정렬합니다. C. 데이터를 Apache ORC 형식으로 저장합니다. 날짜별로 데이터를 분할합니다. 센서 범주별로 데이터를 정렬합니다. D. 데이터를 Parquet 형식으로 저장합니다. 센서 범주별로 데이터를 분할합니다. 날짜별로 데이터를 정렬합니다.

Discussion 0

Correct Answer: D Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 13

한 회사가 데이터 레이크에 데이터를 채우기 위한 새로운 데이터 파이프라인을 구축하고 있습니다. 데이터 분석가는 데이터 엔지니어링 팀이 고급 데이터 변환을 수행하기 전에 데이터를 준비하고 표준화해야 합니다. 데이터 분석가는 새로운 코드를 작성하지 않고 데이터를 처리할 수 있는 솔루션을 필요로 합니다.
어떤 솔루션이 최소한의 운영 노력으로 이러한 요구 사항을 충족할까요?

A. Amazon SageMaker Canvas 및 SageMaker Data Wrangler를 사용하여 새 데이터 세트에 기록합니다. 데이터 엔지니어가 AWS Glue를 사용하여 파이프라인을 완료하기 위한 추가 변환을 수행하도록 합니다. B. 데이터 준비 규칙이 포함된 문서를 생성합니다. 데이터 엔지니어가 AWS Glue에서 해당 규칙을 구현하도록 합니다. C. AWS Glue Studio를 데이터 준비 레시피 변환과 함께 사용하십시오. 데이터 엔지니어가 파이프라인을 완성하기 위해 추가 변환을 추가하도록 하십시오. D. AWS Glue Studio 노트북에서 Python과 Pandas를 사용합니다. 데이터 엔지니어가 파이프라인을 완성하기 위해 추가 변환을 추가하도록 합니다.

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).

Question 14

데이터 엔지니어는 Amazon Redshift 데이터베이스를 기반으로 하는 실체화된 뷰를 유지 관리합니다. 뷰에는 각 행이 로드된 날짜를 저장하는 load_date라는 열이 있습니다.
데이터 엔지니어는 구체화된 뷰에서 모든 행을 삭제하여 데이터베이스 저장 공간을 회수해야 합니다.
어떤 명령이 가장 많은 데이터베이스 저장 공간을 회수할까요?

A. 옵션 D B. 옵션 B C. 옵션 A D. 옵션 C

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).