CloudClass

Building Batch Data Analytics Solutions on AWS

Building Batch Data Analytics Solutions on AWS

  • Level 전문 과정
  • Role 개발자 및 시스템 운영자 및 아키텍처
  • Duration 1 day
  • Price 400,000
배치 데이터솔루션 빌드

교육 개요

이 과정에서는 엔터프라이즈급 Apache Spark 및 Apache Hadoop 관리형 서비스인 Amazon EMR을 통해 배치 데이터 분석 솔루션을 빌드하는 방법을 학습합니다. Amazon EMR를 Apache Hive, Hue, HBase 등의 오픈 소스 프로젝트와 통합하는 방법, AWS Glue 및 AWS Lake Formation 등의 AWS 서비스와 통합하는 방법을 배웁니다. 또한 Spark 및 Hadoop의 맥락에서 데이터 수집, 흡수, 카탈로그화, 저장, 처리 구성 요소를 다룹니다. 수강생은 EMR Notebooks를 사용하여 분석 및 머신러닝 워크로드를 지원하는 방법을 배우게 되며, Amazon EMR 운영에 보안, 성능, 비용 관리 모범 실무를 적용하는 방법도 배우게 됩니다.

교육 대상

  • 데이터 플랫폼 엔지니어
  • 데이터 분석 파이프라인을 구축하고 관리하는 아키텍트 및 운영자

교육 목표

  • 데이터 웨어하우스, 데이터 레이크, 현대적 데이터 아키텍처의 기능 및 이점 비교
  • 배치 데이터 분석 솔루션 설계 및 구현
  • 압축을 포함한 적절한 기술을 파악하고 적용하여 데이터 스토리지 최적화 
  • 데이터 흡수, 변환 및 저장을 위한 적절한 옵션 선택 및 배포
  • 특정 비즈니스 용례에 적합한 인스턴스 및 노드 유형, 클러스터, 오토스케일링 및네트워크 토폴로지 선택
  • 데이터 저장 및 처리가 실행 가능한 비즈니스 인사이트 획득에 필요한 분석 및 시각화 메커니즘에 미치는 영향 이해
  • 저장 데이터 및 전송 데이터 보안
  • 분석 워크로드를 모니터링하여 문제 파악 및 해결
  • 비용 관리 모범 실무 적용

교육 내용

본 과정은 AWS 공인교육으로 AWS 공인강사(AWS Authorized Instructors)가 강의를 진행합니다.

  1. 1day
    • Amazon EMR 소개
    • Amazon EMR 을 사용한 데이터 분석 파이프라인: 데이터 흡수 및 저장
    • Amazon EMR  기반 Apache Spark를 사용한 고성능 배치 데이터 분석
    • Amazon EMR 및 Apache Hive를 사용하여 배치 데이터 처리 및 분석
    • 서버리스 데이터 처리
    • Amazon EMR 클러스터 보안 및 모니터링
    • 배치 데이터 분석 솔루션 설계

     

선수 지식

  • 본 과정은 Apache Spark 또는 Apache Hadoop 등의 오픈 소스 데이터 프레임워크를 1년 이상 관리한 경험이 있는 수강생에게 도움이 됩니다. 
  • AWS Technical Essentials 또는 Architecting on AWS 이수
  • Building Data Lakes on AWS 또는 Getting Started with AWS Glue 이수