BigData
교육목표
- 빅데이터 분석(머신러닝) 프로세스와 각 단계별 필요한 통계를 연결하여 Big Picture를 그리기
- R을 기반으로 예측모델을 구현
- 클라우드 환경에서 제공되는 도구를 활용하여 예측모델과 웹서비스를 구현
강의내용
DAY1
빅데이터 개요
- 빅데이터와 데이터기반 의사결정
- 빅데이터 개요
- 데이터 드리븐
분석 이해
- 분석과 예측
- 분류와 회귀 문제, 비정형 정보 분석 이해
- 머신러닝
- 머신러닝 무작정 따라하기
- 통계가 필요한 단계
R 프로그램 설정
- R프로그램 설정
- 환경설정
- 데이터 자료형
DAY2
R 프로그램 기초
- R 기초
- 데이터 분포(그래프)와 기초통계량
머신러닝 알고리즘 Ⅰ
- 머신러닝 1
- 탐색적 데이터 분석
- 통계 검정(카이제곱검정, t검정, f검정) 사용하여 변량(변수) 비교하기
- 결측치와 이상치 처리
머신러닝 알고리즘 Ⅱ
- 머신러닝 2
- 데이터 전처리(Feature Engineering)
- 변수선택
- 모델링 : 선형알고리즘과 비선형 알고리즘
- 예측 및 검증 : Confusion Matrix, ROC
- 의사결정나무, KNN, SVM, 뉴럴넷 등
- 클라우드 환경에서 머신러닝 구현
- 클라우드 도구를 이용하여 모델링,검증,배포