🎆 빅데이터와 코딩 한 번에 잡기!
머신러닝, 파이썬, 스파크와 같은 최신 기술을 이해하고
트렌드에 맞게 빅데이터를 처리하는 방법을 배울 수 있어요
기본부터 심화까지! 러닝핏과 함께 공부해봐요
👉 이 과정을 수강하면
1. 빅데이터를 통해 수집 및 가공된 데이터를 기계학습을 통하여 목적에 맞게 학습시키고,구현하는 알고리즘을 만들 수 있다.
2. 문제 상황에 맞는 모델을 선택하고, 올바르게 모델을 최적화할 수 있는 기술을 구현할 수 있다.
3. 코드비를 이용하여 지도학습 모델 및 비지도 학습 관련 알고리즘을 구현할 수 있다.
4. 빅데이터를 분산 병렬 처리하기 위한, 아파치 스파크를 이해하고 설명할 수 있다.
5. 스파크의 기본 아키텍처부터 구조적 API 내용, 스파크 SQL 등을 이론 및 실습을 통해, 빅데이터 분석을 위한 방법을 이해하고 설명할 수 있다.
🎈 이런 분들에게 추천드려요!
1. 빅데이터 수집 및 활용하는 방법을 알고, 구현하고자 하는 분
2. 트렌드를 알고, 빅데이터를 생활에 활용하고자 하는 분
3. 블록 코딩을 통해 컴퓨팅적 사고와 직관력을 증진하고자 하는 분
평가기준 | 진도율 | 최종평가 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 과제 | 총점 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
반영비율 | 100% | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 100점 |
수료기준 | 80% | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 60점 |
차시 | 강의명 |
---|---|
1차시 | 인공지능 개요와 발달사 (33분 46초) |
2차시 | 코드비 블록코딩으로 배우는 파이썬과 인공지능 (49분 38초) |
3차시 | 머신러닝 개요 및 학습 방법 (30분 16초) |
4차시 | 지도학습 개요 및 준비 과정 (29분 1초) |
5차시 | 붓꽃(IRIS) 및 당뇨병 데이터를 통한 지도학습 모델 소개 및 실습 (27분 10초) |
6차시 | 유방암 데이터를 통한 지도학습 모델 소개 및 실습 (24분 55초) |
7차시 | 손글씨 데이터를 활용한 지도학습 모델 소개 및 실습 (35분 59초) |
8차시 | 시각화 패키지 소개 및 사용 (35분 52초) |
9차시 | 데이터의 다양한 교차 검증 방식과 평가지표 방식 소개 (30분 24초) |
10차시 | 앙상블(Ensemble) 알고리즘 소개 및 적용 (38분 40초) |
11차시 | 이상탐지 알고리즘 소개 및 적용 실습 (35분 38초) |
12차시 | 비지도 학습 소개 및 차원 축소 기법 (32분 10초) |
13차시 | 비지도 학습의 차원 축소 - ISOMAP, LLE, T-SNE 알고리즘 소개 및 사용방법 (24분 22초) |
14차시 | 비지도 학습의 군집화 - KMEANS 알고리즘 소개 및 데이터 적용 (26분 53초) |
15차시 | 비지도 학습의 군집화 - DBSCAN 알고리즘 소개 및 데이터 적용 (23분 10초) |
16차시 | 빅데이터의 이해 (29분 12초) |
17차시 | 스파크 개요 (24분 27초) |
18차시 | 스파크 설치 및 실행 (33분 58초) |
19차시 | 스파크 기본 아키텍처 및 기본 기능 (33분 9초) |
20차시 | 구조적 API 및 기본 연산 (36분 59초) |
21차시 | 집계 연산 (32분 12초) |
22차시 | 조인 (29분 5초) |
23차시 | 데이터 소스 (31분 42초) |
24차시 | SQL (34분 44초) |
25차시 | 스파크 SQL(하이브, 스파크 SQL 쿼리 실행 방법) (35분 55초) |
26차시 | 스파크 SQL(카탈로그, 테이블, 뷰, 데이터베이스) (32분 6초) |
27차시 | 데이터셋 (33분 38초) |
28차시 | RDD (39분 1초) |
29차시 | RDD 고급 개념 (32분 44초) |
30차시 | 분산형 공유 변수 (34분 25초) |