[머신러닝] 머신러닝의 절차 정리
안녕하세요.
이번 포스팅에서는 머신러닝의 절차를 간략하게 정리해보겠습니다.
머신러닝은
데이터의 이해 -> 데이터 준비 -> 모델링 -> 평가
의 순으로 이루어집니다.
1. 데이터의 이해
(1) Data 로딩
(2) Null Check
- isnull / notnull
-- fillna / dropna
(3) 통계적 요약 정보 확인 : describe
(4) 시각화 : Box, Scatter, Histogram 등 사용
(5) dltkdcl wprj
(6) X / Y의 파악
(7) 비지도 학습을 통한 데이터의 이해 (Clustering 등)
2. 데이터 준비
(1) 데이터 분할 : Train / Test Split
(2) 특성공학 (X값에 대해서)
- 스케일 조정
- 특성 생성 (수학 함수)
- 범주형의 경우 : oine-not
- Y값 연속형일 경우 범주형 변환
3. 모델링
(1) Y 값이 연속된 숫자 : Regression / Y 값이 숫자 X : Classifier
(2) 회귀분석
- Linear Regression : Ridge, Lasso, Elastic Net
- Decision Tree Regression : Random Forest Regression, Gradient Boosting Regression
- SVM (SVR)
- Neural Network (MLP Regression)
(3) 분류
- KNN : Logistic Regression
- Decision Tree Classifier : Random Forest Cassifier, Gradient Boosting Classifier
- SVM (SVC)
- Neural Network (MLP Classifier
4. 평가
(1) 회귀
- R-square (R^2) 이 클 수록 좋다
- MSE, MAE, MAPE 이 작을 수록 좋다
(2) 분류
- Accuracy, Precisior, fl-score, ROC, AVC 등