회사이미지

Academy Program

Home > Academy Program > 전체교육일정

BigData Academy

데이터 전처리를 위한 Python 기반 Spark 프로그래밍

교육일정
교육기간
3일
교육금액
1,200,000원(부가세포함)
BigData Academy전체일정보기 수강신청

교육개요

Analytic 환경 구성에서 필수적으로 필요한 데이터 수집 및 전처리 기술 습득
Deep Learning 분석을 위해 필요한 인코딩 프로세스를 Spark으로 구현할 수 있는 연동 기술 습득



강의내용

Day1

Python Fast Track and Introspection Skill

Docker 기반 개발 환경 구성(Spark,Tensorflow,Hadoop,MariaDB) 및 Jupyter 기초

Python Library : Pandas, Numpy, Seaborn

Day2

Spark 개요 및 기본 운영 실습

Python으로 실습하며 이해하는 FP(함수형 언어)

SparkML 소개 및 실습(k-means)

SparkML 분류 모델 실습(Decision Tree)

Rest Web Service 개요 및 Client 모듈 개발 실습

Day3

Spark기반 이상치 처리 및 결측치 처리 실습

Spark기반 인코딩 모듈 생성 실습

WebService Client to Hadoop/DB 저장 실습

DB/Hadoop to tensorflow 연동 실습

대용량 데이터 수집 및 인코딩 Workshop(교육생 요청에 따라 Crawling 실습으로 대체될 수 있습니다.)