BigData
교육개요
데이터 분석 프로세스를 이해하고 각 단계에서 필요로 하는 기술 내용들을 학습합니다.
Python 시각화 라이브러리인 matplotlib를 활용하고, 정보의 종류에 따라 시각화, 수치화를 통해 분석하는 방법들을 학습합니다.
교육목표
Python 시각화 라이브러리인 matplotlib 라이브러리 사용하고 활용할 수 있습니다.
기초 통계 이론을 바탕으로 다양한 데이터 분석 방법들을 사용할 수 있습니다.
수강대상
- 전처리된 데이터를 정보의 종류와 목적에 맞게 분석해야 하는 데이터 분석 관련 직무 수행자
- 정보의 종류와 목적에 따라 데이터 시각화, 수치화 를 해야하는 업무 종사자
강의내용
1. matplotlib 라이브러리와 분석 프로세스
matplotlib 라이브러리의 기본문법을 통해 차트와 그래프를 그려보고, 분석하는 과정을 학습합니다.
학습내용: 차트, 그래프 그리기, CRISP-DM, 가설 수립
2. 단변량 분석
숫자형 , 범주형 단변량을 시각화 또는 수치화 해보는 과정을 학습합니다.
학습내용: 히스토그램, 밀도함수, 박스 플롯,Bar plot, 빈도수, 비율
3. 가설검정과 평균추정, 신뢰구간
데이터 분석에 필요한 가설, 통계 이론을 학습합니다.
학습내용: 귀무가설과 대립가설, 유의수준과 유의확률, 모집단과 표본, 신뢰구간
4. 숫자형 타겟 이변량 분석
숫자형-> 숫자형 이변량과, 범주형 -> 숫자형 이변량을 시각화 또는 수치화하는 방법을 학습합니다.
학습내용: 산점도, 상관분석, 평균비교, Barplot, t-검정, ANOVA
5. 범주형 타겟 이변량 분석
숫자형-> 범주형 이변량과, 범주형 -> 범주형 이변량을 시각화 또는 수치화하는 방법을 학습합니다.
학습내용: 100% Stacked Bar, Mosaic, 교차표, 카이제곱검정, 히스토그램/KDE plot, 로지스틱회귀