안녕하세요.
이번 포스팅에서는 머신러닝의 절차를 간략하게 정리해보겠습니다.
머신러닝은
데이터의 이해 -> 데이터 준비 -> 모델링 -> 평가
의 순으로 이루어집니다.
1. 데이터의 이해
(1) Data 로딩
(2) Null Check
- isnull / notnull
-- fillna / dropna
(3) 통계적 요약 정보 확인 : describe
(4) 시각화 : Box, Scatter, Histogram 등 사용
(5) dltkdcl wprj
(6) X / Y의 파악
(7) 비지도 학습을 통한 데이터의 이해 (Clustering 등)
2. 데이터 준비
(1) 데이터 분할 : Train / Test Split
(2) 특성공학 (X값에 대해서)
- 스케일 조정
- 특성 생성 (수학 함수)
- 범주형의 경우 : oine-not
- Y값 연속형일 경우 범주형 변환
3. 모델링
(1) Y 값이 연속된 숫자 : Regression / Y 값이 숫자 X : Classifier
(2) 회귀분석
- Linear Regression : Ridge, Lasso, Elastic Net
- Decision Tree Regression : Random Forest Regression, Gradient Boosting Regression
- SVM (SVR)
- Neural Network (MLP Regression)
(3) 분류
- KNN : Logistic Regression
- Decision Tree Classifier : Random Forest Cassifier, Gradient Boosting Classifier
- SVM (SVC)
- Neural Network (MLP Classifier
4. 평가
(1) 회귀
- R-square (R^2) 이 클 수록 좋다
- MSE, MAE, MAPE 이 작을 수록 좋다
(2) 분류
- Accuracy, Precisior, fl-score, ROC, AVC 등
'Computer Etc.' 카테고리의 다른 글
[네트워크] 점보 프레임 (펌) (0) | 2020.08.17 |
---|---|
[클라우드] IaaS, PaaS, SaaS 란? (0) | 2020.07.24 |
[머신러닝] 머신러닝 각 알고리즘 장단점 비교 (펌) (0) | 2020.02.28 |
Copy Better - 드래그 만으로 복사를 해주는 크롬 플러그인 (0) | 2018.07.06 |
[Network] iperf - 네트워크 성능, 대역폭 측정 툴 (리눅스, 윈도우) (0) | 2018.05.14 |