machine learning

GridSearchCV_

임이레 2022. 5. 11. 16:12

GridSearchCV란? 

사이킷런에서 분류알고리즘 또는 회귀알고리즘에 사용되는 하이퍼파라미터를 순차적으로 입력하여 학습하고 측정을 하며 가장 최적의 파라미터를 알려준다. 이 때 GridSearchCV가 없다면 max_depth가 몇일때 최적의 accuracy score을 뽑아내는지 일일이 적용해보아야 알 수 있다. 그러나 gridsearchCV가 있다면 최적화된 파라미터를 단축된 시간으로 뽑아낼 수 있다. 


GridSearchCV class 생성자

-estimator : classifier, regressor, pipeline 등 가능

-param_grid : 튜닝을 위해 파라미터, 사용될 파라미터를 dictionary 형태로 만들어서 넣는다.

-scoring : 예측 성능을 측정할 평가 방법을 넣는다. 보통 accuracy 로 지정하여서 정확도로 성능 평가를 한다.

-cv : 교차 검증에서 몇개로 분할되는지 지정한다.

-refit : True가 디폴트로 True로 하면 최적의 하이퍼 파라미터를 찾아서 재학습 시킨다.