전체교육일정
교육개요
과정명이 변경되었습니다
기존 : Administrator Training: CDP Private Cloud Base
변경된 과정명 : ADMIN-230: Administrating Cloudera Data Platform
CDP(Cloudera Data Platform)는 엣지 투 AI 제품 세트에 완전히 통합됩니다. Cloudera Manager는 Cloudera Data Platform을 구축하고 관리하기 위한 DevOps 툴로 특별히 구축되었습니다. 이 4일간의 실습 과정에서는 성공적인 플랫폼 관리를 위한 자세한 설명, 포괄적인 이론, 핵심 기술 및 권장 사례를 제공합니다. 이 과정을 이수하면 CDP 관리자는 Cloudera Data Platform을 지원하는 Cloudera Manager의 모든 기능을 배우게 됩니다.
이 과정에서는 Cloudera Manager 및 Cloudera Data Platform을 사용하여 생산성을 높일 수 있는 심층적인 설명과 기술을 제공합니다. Cloudera Manager는 모든 기능을 갖춘 완성도 높은 DevOps 도구입니다. CDP를 설치, 구성, 작동, 문제 해결, 보고 및 업그레이드하는 데 사용됩니다. 많은 CDP 관리자는 Cloudera Manager에 내장된 기능 중 일부만 사용합니다. 이 과정에서는 아키텍처, 배포, 구성, 로깅, 보고, REST API 등을 가르칩니다. 이 과정은 전 세계 기업에서 사용하는 아키텍처 및 권장 사례에 대한 참조를 제공합니다
교육목표
본 과정을 수료하면 아래의 교육 목적을 달성할 수 있습니다.
- Cloudera Manager 설치
- Cloudera Manager를 사용하여 CDP Private Cloud Base 클러스터 설치
- Cloudera Manager를 사용하여 클러스터 구성 및 모니터링
- 가장 적합한 데이터 스토리지 옵션을 이해, 평가 및 선택
- 클러스터 성능 최적화
- 일상적인 클러스터 유지 관리 작업 수행
- 클러스터 문제 감지, 문제 해결 및 복구 데이터 흐름 최적화 방법과 사용 가능한 모니터링 및 리포트 기능 구현
수강대상
데이터 관리자, 시스템 관리자
선수과목
리눅스 기본 사용
CDP 또는 Cloudera의 CDH 또는 Hortonworks HDP와 같은 이전 플랫폼에 대한 사전 지식은 필요하지 않습니다.
강의내용
1. Cloudera 데이터 플랫폼
-빅 데이터 업계 동향
-Data-Driven이 되기위한 도전
-엔터프라이즈 데이터 클라우드
-CDP 개요
-CDP 폼 팩터
2. CDP Private Cloud base 설치
-설치 개요
-Cloudera Manager 설치
-CDP 런타임 개요
-Cloudera Manager 소개
3. 클러스터 구성
-개요
-구성 설정
-서비스 구성 수정
-구성 파일
-역할 인스턴스 관리
-새로운 서비스 추가
-호스트 추가 및 제거
4. 데이터 스토리지
-개요
-HDFS 토폴로지 및 역할
-HDFS 성능 및 내결함성
-HDFS 및 Hadoop 보안 개요
-HDFS 작업
-HBase 개요
-Kudu 개요
-클라우드 스토리지 개요
5. 데이터 수집
-데이터 수집 개요
-파일 형식
-파일 전송 또는 REST 인터페이스를 사용하여 데이터 수집
-Apache Sqoop을 사용하여 관계형 데이터베이스에서 데이터 가져 오기
-NiFi를 사용하여 데이터 수집
-데이터 가져 오기 모범 사례
6. 데이터 흐름
-Cloudera Flow Management 및 NiFi 개요
-NiFi 아키텍처
-Cloudera Edge 흐름 관리 및 MiNiFi
-컨트롤러 서비스
-Apache Kafka 개요
-Apache Kafka 클러스터 아키텍처
-Apache Kafka 명령 줄 도구
7. 데이터 액세스 및 검색
-Apache Hive
-Apache Impala
-Apache Impala 조정
-검색 개요
-Hue 개요
-Hue 관리 및 구성
-Hue 인증 및 승인
-CDSW 개요
8. 데이터 컴퓨팅
-YARN 개요
-YARN에서 애플리케이션 실행
-YARN 애플리케이션보기
-YARN 애플리케이션 로그
-MapReduce 애플리케이션
-YARN 메모리 및 CPU 설정
-Tez 개요
-Tez의 하이브
-Hive 용 ACID
-Spark 개요
-Spark 애플리케이션이 YARN에서 실행되는 방법
-Spark 애플리케이션 모니터링
-Phoenix 개요
9. 자원 관리
-CPU 스케줄링으로 cgroup 구성
-용량 스케줄러
-대기열 관리
-Impala 쿼리 예약
10. 클러스터 계획하기
- 일반적인 고려 사항
-올바른 하드웨어 선택
-네트워크 고려 사항
-CDP 사설 클라우드 고려 사항
-노드 구성
11. 고급 클러스터 구성
-서비스 포트 구성
-HDFS 및 MapReduce 조정
-클러스터 증가 관리
-이레이저 코딩
-HDFS 고 가용성 활성화
12. 클러스터 유지 관리
-HDFS 상태 확인
-클러스터 간 데이터 복사
-HDFS에서 데이터 재조정
-HDFS 디렉토리 스냅 샷
-호스트 유지 관리
-클러스터 업그레이드
13. 클러스터 모니터링
-Cloudera Manager 모니터링 기능
-건강 테스트
-이벤트 및 경고
-차트 및 보고서
-권장 사항 모니터링
14. 클러스터 문제 해결
-개요
-문제 해결 도구
-잘못된 구성 예
15. 보안
-SDX를 통한 데이터 거버넌스
-Hadoop 보안 개념
-Kerberos를 사용한 Hadoop 인증
-Hadoop 인증
-Hadoop 암호화
-Hadoop 클러스터 보안
-아파치 레인저
-Apache Atlas
-백업 및 복구
16. 프라이빗 클라우드 / 퍼블릭 클라우드
-CDP 개요
-사설 클라우드 기능
-퍼블릭 클라우드 기능
-Kubernetes 란 무엇입니까?
-WXM 개요
-자동 확장
기타
권장되는 다음 교육 과정
ADMIN-332: Building Secure Cloudera Clusters