Amazon AWS Certified Data Engineer - Associate (DEA-C01) (Data-Engineer-Associate Korean Version) - Data-Engineer-Associate Korean FREE EXAM DUMPS QUESTIONS & ANSWERS
한 회사가 온프레미스 서버의 로그 파일을 Amazon S3 버킷에 업로드하고 있습니다. 이 회사는 온프레미스 서버의 로그와 S3 버킷에 저장된 로그가 동일한지 검증해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?
어떤 솔루션이 이 요구 사항을 충족할까요?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사에서 Amazon RDS for MySQL 데이터베이스에 대한 로그를 수집하고 감사를 위해 제공해야 합니다. 로그는 데이터베이스의 데이터를 수정하거나 데이터베이스 인스턴스를 변경하는 각 사용자를 추적해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사는 Apache Spark 작업을 실행하는 프로비저닝된 Amazon EMR 클러스터를 사용하여 빅 데이터 분석을 수행할 계획입니다. 회사는 높은 신뢰성을 요구합니다. 빅 데이터 팀은 Amazon EMR에서 비용 최적화된 장기 실행 워크로드를 실행하기 위한 모범 사례를 따라야 합니다. 팀은 회사의 현재 성과 수준을 유지할 수 있는 솔루션을 찾아야 합니다.
이러한 요구 사항을 가장 비용 효율적으로 충족할 수 있는 리소스 조합은 무엇입니까? (2개를 선택하세요.)
이러한 요구 사항을 가장 비용 효율적으로 충족할 수 있는 리소스 조합은 무엇입니까? (2개를 선택하세요.)
Correct Answer: B,D
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
데이터 엔지니어가 데이터 처리 작업을 수행하기 위해 Amazon Athena에 있는 기존 테이블의 빈 복사본을 생성해야 합니다. Athena의 기존 테이블에는 1,000개의 행이 있습니다.
어떤 쿼리가 이 요구 사항을 충족할까요?
어떤 쿼리가 이 요구 사항을 충족할까요?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
회사에는 Amazon S3 버킷에 저장된 데이터 세트를 사용하는 여러 애플리케이션이 있습니다. 회사에는 개인 식별 정보(PII)가 포함된 데이터 세트를 생성하는 전자 상거래 애플리케이션이 있습니다.
회사에는 PII에 액세스할 필요가 없는 내부 분석 애플리케이션이 있습니다.
규정을 준수하기 위해 회사는 PII를 불필요하게 공유해서는 안 됩니다. 데이터 엔지니어는 데이터 세트에 액세스하는 각 애플리케이션의 요구 사항에 따라 PII를 동적으로 수정하는 솔루션을 구현해야 합니다.
최소한의 운영 오버헤드로 요구 사항을 충족하는 솔루션은 무엇입니까?
회사에는 PII에 액세스할 필요가 없는 내부 분석 애플리케이션이 있습니다.
규정을 준수하기 위해 회사는 PII를 불필요하게 공유해서는 안 됩니다. 데이터 엔지니어는 데이터 세트에 액세스하는 각 애플리케이션의 요구 사항에 따라 PII를 동적으로 수정하는 솔루션을 구현해야 합니다.
최소한의 운영 오버헤드로 요구 사항을 충족하는 솔루션은 무엇입니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
어떤 회사에는 개인 식별 정보(PIT) 데이터와 비 PII 데이터가 포함된 JSON 파일이 있습니다.
회사는 쿼리 및 분석을 위해 데이터를 제공해야 합니다. 개인 식별 정보가 아닌 데이터는 회사 내 모든 사람이 이용할 수 있어야 합니다. 개인 식별 정보는 제한된 직원 그룹에게만 제공되어야 합니다. 운영 오버헤드를 최소화하면서 이러한 요구 사항을 충족하는 솔루션은 무엇일까요?
회사는 쿼리 및 분석을 위해 데이터를 제공해야 합니다. 개인 식별 정보가 아닌 데이터는 회사 내 모든 사람이 이용할 수 있어야 합니다. 개인 식별 정보는 제한된 직원 그룹에게만 제공되어야 합니다. 운영 오버헤드를 최소화하면서 이러한 요구 사항을 충족하는 솔루션은 무엇일까요?
Correct Answer: C
Vote an answer
차량 공유 회사는 모든 탑승 기록을 Amazon DynamoDB 테이블에 저장합니다. 해당 테이블에는 다음과 같은 열과 값 유형이 포함됩니다.
라이드아이디 | 라이더ID | 운전자ID | 탑승 상태 | 여행시작시간 | 여행 종료 시간
XA1231 | AXEF1 | BN123 | 활성 | 2025-02-11 | NULL
XA1232 | AXEF2 | BN124 | 완료 | 2025-02-11 | 2025-02-11
현재 테이블에는 수십억 개의 항목이 저장되어 있습니다. 테이블은 탑승 ID(RideID)를 기준으로 분할되어 있으며, 출발 시간(TripStartTime)을 정렬 키로 사용합니다. 회사는 이 데이터를 활용하여 운전자가 탑승 상태(RideStatus)를 기반으로 각 운전자가 완료한 탑승 내역을 확인할 수 있는 개인 맞춤형 인터페이스를 구축하고자 합니다. 이 솔루션은 테이블 전체를 스캔하지 않고 필요한 데이터에만 접근해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
라이드아이디 | 라이더ID | 운전자ID | 탑승 상태 | 여행시작시간 | 여행 종료 시간
XA1231 | AXEF1 | BN123 | 활성 | 2025-02-11 | NULL
XA1232 | AXEF2 | BN124 | 완료 | 2025-02-11 | 2025-02-11
현재 테이블에는 수십억 개의 항목이 저장되어 있습니다. 테이블은 탑승 ID(RideID)를 기준으로 분할되어 있으며, 출발 시간(TripStartTime)을 정렬 키로 사용합니다. 회사는 이 데이터를 활용하여 운전자가 탑승 상태(RideStatus)를 기반으로 각 운전자가 완료한 탑승 내역을 확인할 수 있는 개인 맞춤형 인터페이스를 구축하고자 합니다. 이 솔루션은 테이블 전체를 스캔하지 않고 필요한 데이터에만 접근해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사가 Amazon Redshift를 데이터 웨어하우스로 사용합니다. 데이터 인코딩은 데이터 웨어하우스의 기존 테이블에 적용됩니다. 데이터 엔지니어는 일부 테이블에 적용된 압축 인코딩이 데이터에 가장 적합하지 않다는 것을 발견합니다.
데이터 엔지니어는 최적이 아닌 인코딩이 있는 테이블의 데이터 인코딩을 개선해야 합니다.
어떤 솔루션이 이 요구 사항을 충족시킬까요?
데이터 엔지니어는 최적이 아닌 인코딩이 있는 테이블의 데이터 인코딩을 개선해야 합니다.
어떤 솔루션이 이 요구 사항을 충족시킬까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사는 분기마다 데이터 레이크의 데이터를 분석하여 재고 평가를 수행합니다. 데이터 엔지니어는 AWS Glue DataBrew를 사용하여 데이터 내에서 고객에 대한 개인 식별 정보(PII)를 감지합니다.
회사의 개인정보 보호정책은 일부 사용자 지정 정보 범주를 PII로 간주합니다. 그러나 이러한 범주는 표준 DataBrew 데이터 품질 규칙에 포함되지 않습니다.
데이터 엔지니어는 데이터 레이크 내의 여러 데이터 세트에서 사용자 정의 PII 범주를 스캔하기 위해 현재 프로세스를 수정해야 합니다.
어떤 솔루션이 운영 비용을 최소화하면서 이러한 요구 사항을 충족할 수 있을까요?
회사의 개인정보 보호정책은 일부 사용자 지정 정보 범주를 PII로 간주합니다. 그러나 이러한 범주는 표준 DataBrew 데이터 품질 규칙에 포함되지 않습니다.
데이터 엔지니어는 데이터 레이크 내의 여러 데이터 세트에서 사용자 정의 PII 범주를 스캔하기 위해 현재 프로세스를 수정해야 합니다.
어떤 솔루션이 운영 비용을 최소화하면서 이러한 요구 사항을 충족할 수 있을까요?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사에 Sales라는 이름의 테이블이 포함된 데이터 웨어하우스가 있습니다. 이 회사는 Amazon Redshift에 테이블을 저장합니다. 이 테이블에는 city_name이라는 이름의 열이 있습니다. 이 회사는 "San" 또는 "El"로 시작하는 city_name이 있는 모든 행을 찾기 위해 테이블을 쿼리하려고 합니다. 이 요구 사항을 충족하는 SQL 쿼리는 무엇입니까?
Correct Answer: A
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
데이터 엔지니어는 AWS Glue 대화형 세션을 사용하여 기계 학습(ML) 모델용 데이터를 준비하도록 Amazon SageMaker Studio를 구성하고 있습니다.
데이터 엔지니어가 SageMaker Studio를 사용하여 데이터를 준비하려고 하면 액세스 거부 오류가 발생합니다.
SageMaker Studio에 액세스하려면 엔지니어가 어떤 변경을 해야 합니까?
데이터 엔지니어가 SageMaker Studio를 사용하여 데이터를 준비하려고 하면 액세스 거부 오류가 발생합니다.
SageMaker Studio에 액세스하려면 엔지니어가 어떤 변경을 해야 합니까?
Correct Answer: C
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사가 고빈도 센서 원격 측정 데이터를 아마존 S3 데이터 레이크에 집계합니다. 각 센서 스트림은 매시간 구조화된 레코드를 전송합니다. 이 레코드에는 센서 범주, 장치 ID, 작동 상태, 이벤트 타임스탬프, 사이트 위치와 같은 메타데이터가 포함됩니다. 데이터는 매일 수백만 건의 레코드로 증가합니다. 이 회사는 센서 범주별 성능 관련 인사이트를 도출하기 위해 매일 복잡한 쿼리를 실행합니다.
어떤 솔루션이 이러한 요구 사항을 충족하면서 가장 빠른 쿼리 실행 시간을 제공할까요?
어떤 솔루션이 이러한 요구 사항을 충족하면서 가장 빠른 쿼리 실행 시간을 제공할까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
한 회사가 데이터 레이크에 데이터를 채우기 위한 새로운 데이터 파이프라인을 구축하고 있습니다. 데이터 분석가는 데이터 엔지니어링 팀이 고급 데이터 변환을 수행하기 전에 데이터를 준비하고 표준화해야 합니다. 데이터 분석가는 새로운 코드를 작성하지 않고 데이터를 처리할 수 있는 솔루션을 필요로 합니다.
어떤 솔루션이 최소한의 운영 노력으로 이러한 요구 사항을 충족할까요?
어떤 솔루션이 최소한의 운영 노력으로 이러한 요구 사항을 충족할까요?
Correct Answer: C
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).
데이터 엔지니어는 Amazon Redshift 데이터베이스를 기반으로 하는 실체화된 뷰를 유지 관리합니다. 뷰에는 각 행이 로드된 날짜를 저장하는 load_date라는 열이 있습니다.
데이터 엔지니어는 구체화된 뷰에서 모든 행을 삭제하여 데이터베이스 저장 공간을 회수해야 합니다.
어떤 명령이 가장 많은 데이터베이스 저장 공간을 회수할까요?

데이터 엔지니어는 구체화된 뷰에서 모든 행을 삭제하여 데이터베이스 저장 공간을 회수해야 합니다.
어떤 명령이 가장 많은 데이터베이스 저장 공간을 회수할까요?

Correct Answer: C
Vote an answer
Explanation: Only visible for FreeCram members. You can sign-up / login (it's free).