일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Python
- Quickstart
- 자동화
- 파이썬독학
- OpenAPI
- 웹크롤링
- 머신러닝
- 간단한파이썬게임
- 파이썬게임만들기
- 카카오
- 파이썬간단한게임
- 구글캘린더
- kakao
- 파이썬
- 크롤링
- STT
- 기본기
- 딥러닝
- 구글일정
- 구글
- 업무자동화
- 음성인식
- 인공지능
- Ai
- 오늘배워오늘쓰는
- Selenium
- 빅데이터
- 독학
- 파이썬게임
- 소스코드
- Today
- Total
목록데이터 분석/왕초보를 위한 머신러닝 (15)
ai-creator

목차 1. 오차행렬 (Confusion Matirx) 2. 평가 지표 2-1) Accuracy, Precision, Recall 2-2) F1-Score 2-3) ROC Curve와 AUC 1. 오차행렬 (Confusion Matrix) 의미 알고리즘이 예측을 수행하면서 얼마나 헷갈리고(confused) 있는지 보여지는 지표이다. 매우 혼란스러운 행렬이지만, 모든 값은 "예측"이 기준이다. True Negative (TN) 맞췄다. Negative로 예측해서 False Positive (FP) 틀렸다. Positive로 예측해서 실제는 Negative False Negative (FN) 틀렸다. Negative로 예측해서 실제는 Positive True Positive (TP) 맞췄다. Positive로..

이전 포스팅에서 2가지를 언급했다. 1) 머신러닝이란? (Link) : input ----> [ 패턴인식을 위한 머신러닝 알고리즘 ] ----> output 2) 머신러닝을 도와줄 python 패키지 : Scikit-learn 머신러닝 알고리즘을 사용하기 앞서 해야할 일은 input 가공하는 일이라고 했으며, - 학습/테스트를 위한 데이터 분리 및 이에 맞춘 Sklearn API 사용법과 예시를 알아보았다. (Link) 이번장에서는 '기계'가 더 잘 이해할 수 있는 데이터 가공법에 대해서 알아보겠다. ㅁ 데이터 인코딩 (data encoding) 컴퓨터가 이해하기 위해서는 모든 데이터의 표현이 '숫자'형으로 되어 있어야 한다. 쉽게 풀어서 이야기하면, 텍스트로 이루어진 데이터를 '숫자'로 표현하기를 원한..

이전 포스팅에서 2가지를 언급했다. 1) 머신러닝이란? (Link) : input ----> [ 패턴인식을 위한 머신러닝 알고리즘 ] ----> output 2) 머신러닝을 도와줄 python 패키지 : Scikit-learn 머신러닝 알고리즘을 사용하기 앞서 해야할 일은 input 가공하는 일이다. 지도학습에 있어 데이터 처리(input가공)는 여러가지가 있다. 이번장에서는 - 학습/테스트를 위한 데이터 분리 및 이에 맞춘 Sklearn API 사용법과 예시를 다뤄보겠다. 이에 대해서 좀 더 자세히 알아보겠다. ㅁ 학습/테스트를 위한 데이터 분리 머신러닝에서의 지도학습은 인간의 학습방법과 유사하다. 여기서 머신러닝의 진행 순서를 살펴보자. "학습 -> 테스트 -> 평가" 이 과정을 반복한다. 원하는 평..

최종 목표 지도학습에서 최종목표는 titanic 데이터를 이용하여 생존여부를 예측하는 코드를 이해하는 것이다. 코드 이해에 있어 - 지도학습 수행을 위한 프로세스를 이해한다. - 프로세스의 각 단계별 필요성을 이해한다. - 프로세스별 Sklearn API를 연결시킨다. 지도학습을 위한 프로세스 프로세스별 Sklearn API 참고1) titanic 데이터로 생존여부 예측 소스코드 https://drive.google.com/file/d/12Us7k-8rOe9kBtzF3tCoRF4EYuF9BXEO/view?usp=sharing 2.6 사이킷런으로 수행하는 타이타닉 생존자 예측 .ipynb drive.google.com 참고2) 소스코드에 있는 Sklearn API 의미 파악 import API from s..

개념 관상, 손금은 어떤 공통점이 있을까? 여러 데이터들을 모아서 그간의 행적을 파악하고, 미래를 예측하는 공통점이 있다. 머신러닝도 마찬가지이다. 과거데이터를 통해 패턴을 파악하고 예측을 하는것이다. 과거 데이터 -> 패턴 파악 -> 예측 이는 마치 함수와 같다. input / process / output 3가지 구성요소를 지닌 함수 말이다. 즉 input으로 과거 데이터를 process로는 패턴을 파악하는 연산을 output으로는 예측값을 의미하게 된다. 패턴을 파악하는 연산을 과거에는 인간이 직접하였지만, 이제 이런것은 컴퓨터에게 맡기자!가 머신러닝이라고 생각하면 된다. 패턴 : 인간의 뇌 -> 컴퓨터의 연산 단순히 이야기 하면, 만약 귓볼이 크다면, 복이 있다의 패턴을 if-else 문으로 바꾼..