Search Training

기술분야 Cloudera 신청하기
교육일정 2017-09-11~2017-09-13 교육 기간 3 일
교육 금액 1,914,000원 쿠폰등록시 23매
접수파일
이벤트&프로모션
과정 설명
본 과정은 실시간 쿼리를 위해 Hadoop에서 데이터를 인덱싱하려는 개발자 및 데이터 엔지니어를 위한 과정입니다. 교육생들은 Cloudera Search를 외부 응용 프로그램과 통합함으로써 데이터에서 더 많은 가치를 창출하는 방법을 배울 수 있습니다.
수강 대상
Java, C, C ++ Perl, Python 등의 언어로 프로그래밍을 해 본 개발자 및 데이터 엔지니어
과정 소개
Module1. Cloudera Search 개요
• Cloudera Search란 무엇인가?
• 유용한 기능, 사용 사례, 기본 아키텍처

Module2. 기본 쿼리 수행
• Admin UI에서 쿼리 실행
• 기본 구문, 근사 일치 기법, 출력 제어

Module3. 보다 강력한 쿼리 작성
• 관련성 및 필터
• 쿼리 구문 분석기
• 기능, 지리 정보 Search
• 측면 화

Module4. 색인 문서 준비
• Indexing Process개요
• Morphlines 이해하기
• 구성 파일 생성
• 디자인 계획
• 컬렉션 관리

Module5. MapReduce로 HDFS 데이터 Indexing 일괄 처리
• HDFS 배치 Indexing 개요
• MapReduce Indexing 도구 사용
• 테스트 및 문제 해결

Module6. Flume 의한 실시간 Indexing
• 실시간 Indexing 프로세스의 개요
• Apache Flume 소개
• Flume으로 실시간 Indexing을 수행하는 방법
• 테스트 및 문제 해결

Module7. 릴리로 HBase 데이터 Indexing
• Apache HBase 란 무엇인가?
• HBase의 배치 Indexing
• 실시간으로 HBase 테이블 Indexing

Module8. 다른 언어 및 형식의 데이터 Indexing
• 필드 유형 및 분석기 체인
• Word Stemming, 문자 Mapping 및 언어 지원
• 관리 UI에서의 스키마 및 분석 지원
• Apache Tika로 Metadata 및 컨텐트 추출
• SolrCell을 사용하여 이진 파일 형식 Indexing

Module9. Search 품질 및 성능 향상
• 관련 결과 전달
• 사용자가 정보를 찾을 수 있도록 돕기
• 성능 쿼리 및 문제 해결

Module10. Search을위한 사용자 인터페이스 작성
• Search UI 개요
• 색조로 사용자 인터페이스 만들기
• 사용자 정의 응용 프로그램에 Search 통합

Module11. 배포 고려 사항
• 배포 계획
• 하드웨어 요구 사항 결정
• 보안 개요
• Collection Aliasing

교육 장소
한국글로벌널리지 교육센터

[찾아오시는 길]
서울특별시 강남구 테헤란로 222 도원빌딩 3층~4층

[교육장 약도]