카테고리 없음

ML Project Frame _ kaggle 코드 공부

임이레 2022. 11. 10. 16:52

1. 필요한 라이브러리와 데이터 코드를 불러온다. 

2. EDA를 수행한다.  (문제정의를 통한 '풀어나가야하는 문제' => 목적을 계속 상기할 것.) 

3. 전처리를 수행한다. (이 때 중요한 것 'feature engineering' 을 어떻게 할 것인가? ) 

4. train data 와 test Data의 분할 => 데이터 분할 진행.

5. 학습 진행 ( 어떤 모델을 사용하여 학습할지 정합니다. 성능이 잘 나오는 GBM 을 추천합니다.) 

6. hyper - parameter tuning을 수행. 원하는 목표 성능이 나올떄까지 진행한다. validation 단계를 통해 지속적으로 over-fitting되지 않게 주의 해야 한다.

7. 최종 테스트 진행. 데이터 분석 대회 format 에 맞는 submission파일을 만들어서 성능을 확인.