데이터 분석/왕초보를 위한 머신러닝
[머신러닝 기초] 지도학습 - 맛보기 (w/사이킷런)
ai-creator
2021. 9. 24. 13:01
반응형
최종 목표
지도학습에서 최종목표는 titanic 데이터를 이용하여 생존여부를 예측하는 코드를 이해하는 것이다.
코드 이해에 있어
- 지도학습 수행을 위한 프로세스를 이해한다.
- 프로세스의 각 단계별 필요성을 이해한다.
- 프로세스별 Sklearn API를 연결시킨다.
지도학습을 위한 프로세스
프로세스별 Sklearn API
참고1) titanic 데이터로 생존여부 예측 소스코드
https://drive.google.com/file/d/12Us7k-8rOe9kBtzF3tCoRF4EYuF9BXEO/view?usp=sharing
참고2) 소스코드에 있는 Sklearn API 의미 파악
import | API |
from sklearn.model_selection import train_test_split | train_test_split() |
from sklearn.tree import DecisionTreeClassifier | DecisionTreeClassifier() - fit() - predict() |
from sklearn.metrics import accuracy_score | accuracy_score() |
from sklearn.model_selection import KFold | KFold() - split() |
from sklearn.model_selection import cross_val_score | cross_val_score() |
from sklearn.model_selection import GridSearchCV | GridSearchCV() |
다음장에서는 알고리즘을 사용하기 전 '데이터 처리' 에 대해서 학습해보겠다.
ㅁ Reference
- 소스코드 출처 : https://github.com/wikibook/pymldg-rev
반응형