반응형

안녕하세요.

 

이번 포스팅에서는 머신러닝의 절차를 간략하게 정리해보겠습니다.

 

머신러닝은

 

데이터의 이해 -> 데이터 준비 -> 모델링 -> 평가

 

의 순으로 이루어집니다.

 

 

1. 데이터의 이해

 

 (1) Data 로딩

 

 (2) Null Check

    - isnull / notnull

    -- fillna / dropna

 

 (3) 통계적 요약 정보 확인 : describe

 

 (4) 시각화 : Box, Scatter, Histogram 등 사용

 

 (5) dltkdcl wprj

 

 (6) X / Y의 파악

 

 (7) 비지도 학습을 통한 데이터의 이해 (Clustering 등)

 

 

2. 데이터 준비

 

 (1) 데이터 분할 : Train / Test Split

 

 (2) 특성공학 (X값에 대해서)

    - 스케일 조정

    - 특성 생성 (수학 함수)

    - 범주형의 경우 : oine-not

    - Y값 연속형일 경우 범주형 변환

 

 

3. 모델링

 

(1) Y 값이 연속된 숫자 : Regression / Y 값이 숫자 X : Classifier

 

(2) 회귀분석

   - Linear Regression : Ridge, Lasso, Elastic Net

   - Decision Tree Regression : Random Forest Regression, Gradient Boosting Regression

   - SVM (SVR)

   - Neural Network (MLP Regression)

 

(3) 분류

   - KNN : Logistic Regression

   - Decision Tree Classifier : Random Forest Cassifier, Gradient Boosting Classifier

   - SVM (SVC)

   - Neural Network (MLP Classifier

 

 

4. 평가

 

 (1) 회귀

   - R-square (R^2) 이 클 수록 좋다

   - MSE, MAE, MAPE 이 작을 수록 좋다

 

 (2) 분류

   - Accuracy, Precisior, fl-score, ROC, AVC 등

반응형
Posted by 해리팍
BLOG main image

Chanhyun Park (해리팍)
Software Engineer @ SK hynix

Contact Info.
parkch0708@hanmail.net
chanhyun0708@gmail.com
chanhyun.park@sk.com

카테고리

All (1502)
Profile (2)
Park's Life (600)
Computer System (165)
Computer Programming (39)
Computer Study (54)
Computer Etc. (189)
Scuba Diving (137)
Golf (8)
Traveling (245)
생활 정보 (12)
Pokemon GO (50)