Computer Etc.

[머신러닝] 머신러닝의 절차 정리

해리팍 2020. 3. 2. 07:24
반응형

안녕하세요.

 

이번 포스팅에서는 머신러닝의 절차를 간략하게 정리해보겠습니다.

 

머신러닝은

 

데이터의 이해 -> 데이터 준비 -> 모델링 -> 평가

 

의 순으로 이루어집니다.

 

 

1. 데이터의 이해

 

 (1) Data 로딩

 

 (2) Null Check

    - isnull / notnull

    -- fillna / dropna

 

 (3) 통계적 요약 정보 확인 : describe

 

 (4) 시각화 : Box, Scatter, Histogram 등 사용

 

 (5) dltkdcl wprj

 

 (6) X / Y의 파악

 

 (7) 비지도 학습을 통한 데이터의 이해 (Clustering 등)

 

 

2. 데이터 준비

 

 (1) 데이터 분할 : Train / Test Split

 

 (2) 특성공학 (X값에 대해서)

    - 스케일 조정

    - 특성 생성 (수학 함수)

    - 범주형의 경우 : oine-not

    - Y값 연속형일 경우 범주형 변환

 

 

3. 모델링

 

(1) Y 값이 연속된 숫자 : Regression / Y 값이 숫자 X : Classifier

 

(2) 회귀분석

   - Linear Regression : Ridge, Lasso, Elastic Net

   - Decision Tree Regression : Random Forest Regression, Gradient Boosting Regression

   - SVM (SVR)

   - Neural Network (MLP Regression)

 

(3) 분류

   - KNN : Logistic Regression

   - Decision Tree Classifier : Random Forest Cassifier, Gradient Boosting Classifier

   - SVM (SVC)

   - Neural Network (MLP Classifier

 

 

4. 평가

 

 (1) 회귀

   - R-square (R^2) 이 클 수록 좋다

   - MSE, MAE, MAPE 이 작을 수록 좋다

 

 (2) 분류

   - Accuracy, Precisior, fl-score, ROC, AVC 등

반응형