데이터 청년 캠퍼스 연세대학교

데이터 청년 캠퍼스 연세대학교

빅데이터 분석처리 과정

과정개요

  • 운영대학

    연세대학교

  • 과정 개요 및 특징

    · 파이썬, spark 등 다양한 빅데이터 분석도구 활용
    · 데이터베이스와 연동한 분석 학습
    · 머신 러닝, 딥러닝 기법을 활용한 실전 KDD 프로세스 분석 실습 교육

  • 교육기간

    이론실습 : 2020. 7. 6 ~ 8. 16 / 09:30 ~ 17:30
    프로젝트 : 2020. 8. 17 ~ 9. 4 / 09:30 ~ 17:30
    프로젝트 보완 및 제출(비대면) : 2020. 9. 7 ~ 9. 18

  • 교육인원

    66 명

  • 준비사항

    · 노트북 지참 필수 (CPU i5, 메모리 8G 권장)

  • 우대사항

    · 대학 평점 80점 이상자
    · 빅데이터, 컴퓨터 프로그래밍 관련 과목 이수
    · 관련 동아리 활동, 경진대회 혹은 공모전 수상 경험자
    · 전공무관

상세 커리큘럼

 
구분 교과목명 주요 내용 시간
온라인교육 -
교육 내용  빅데이터 분석  빅데이터 정의 및 개념, 가치 및 트렌드 이해, 빅데이터 주요 기술 소개 3H
파이썬 프로그래밍  개발 도구 및 빌드 환경의 이해, 데이터 유형 및 기초 문법, 데이터베이스 연동, 쥬피터를 통한 interactive programming 35H
데이터 분석 기초 및 시각화  numpy, pandas, matploylib 라이브러리를 사용한 데이터 분석 28H
데이터베이스와 SQL  SQL 기본 개념, SQL 주요 문법 설명(select, join, agregate), 고급 문법 활용 설명(subquery, view …) 7H
빅데이터 전처리  데이터 정제, 통합, 변환, 축소, 이산화 기법 14H
고급 데이터 분석  분석 방법론, 클러스터링, 연관규칙, 빈발패턴, 순차패턴, 결정트리 기법, xgBoost, 인공신경망 61H
크롤링 및 소셜 분석  웹페이지 크롤링, 자연어 처리 21H
실전 KDD 프로세스 분석 실습  실전 프로젝트 실습, 실무 분석 21H
Spark 기반 배치/실시간 빅데이터 처리  Apache Spark 아키텍쳐, Spark SQL, Spark Streaming, Zepplin 10H
프로젝트 팀 및 주제 선정  프로젝트 팀 선정, 주제 선정, 데이터 선정 및 분석방법론 설계 14H
프로젝트 수행  팀 프로젝트 및 특강 69H
프로젝트 발표 및 보완 프로젝트 발표식, 보완 개선 7H
 

교육장소

교육장연세대학교 제4공학관 D403, D404