데이터 분석/왕초보를 위한 머신러닝

[머신러닝 기초] 지도학습 - 맛보기 (w/사이킷런)

ai-creator 2021. 9. 24. 13:01
반응형

최종 목표

지도학습에서 최종목표는 titanic 데이터를 이용하여 생존여부를 예측하는 코드를 이해하는 것이다.

코드 이해에 있어

- 지도학습 수행을 위한 프로세스를 이해한다.

- 프로세스의 각 단계별 필요성을 이해한다.

- 프로세스별 Sklearn API를 연결시킨다.

 

지도학습을 위한 프로세스

 

프로세스별 Sklearn API

참고1) titanic 데이터로 생존여부 예측 소스코드

https://drive.google.com/file/d/12Us7k-8rOe9kBtzF3tCoRF4EYuF9BXEO/view?usp=sharing 

 

2.6 사이킷런으로 수행하는 타이타닉 생존자 예측 .ipynb

 

drive.google.com

 

참고2) 소스코드에 있는 Sklearn API 의미 파악

import API
from sklearn.model_selection import train_test_split train_test_split()
from sklearn.tree import DecisionTreeClassifier DecisionTreeClassifier()
- fit()
- predict()
from sklearn.metrics import accuracy_score accuracy_score()
from sklearn.model_selection import KFold KFold()
- split()
from sklearn.model_selection import cross_val_score cross_val_score()
from sklearn.model_selection import GridSearchCV GridSearchCV()

 

다음장에서는 알고리즘을 사용하기 전 '데이터 처리' 에 대해서 학습해보겠다.

 

 

ㅁ Reference

- 소스코드 출처 : https://github.com/wikibook/pymldg-rev

반응형