Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Machine Learning
- 덴드로그램
- DataAccess
- list
- pandas
- 최솟값
- del
- hierarchical_clustering
- 최댓값
- insert()
- DataFrame
- IN
- function
- numpy
- string
- sklearn
- 분류 결과표
- Dictionary
- data
- analizer
- append()
- wcss
- 반복문
- dendrogram
- nan
- count()
- matplotlib
- Python
- len()
- elbow method
Archives
- Today
- Total
개발공부
Grid Search란 ? sklearn 라이브러리의 GridSearchCV 사용법 본문
Grid Search
우리가 지정해준 잠재적 Parameter 들의 후보군 조합중에서 가장 최적의 조합을 찾아준다.
sklearn 라이브러리에서 이를 제공해 주고 있어 쉽게 사용 가능하다.
예제
from sklearn.model_selection import GridSearchCV
우리는 Support Vector Machine 방식을 사용하겠다.
# 파라미터의 조합으로 사용할 값들을 설정해준다.
param_grid = { 'C' : [0.1, 1, 10, 100],
'kernel' : ['linear', 'rbf', 'poly'],
'gamma' : [1, 0.1, 0.01]}
# estimator : classifier, regressor, pipeline 등 가능
# refit : True가 디폴트로 True로 하면 최적의 하이퍼 파라미터를 찾아서 재학습 시킨다.
# verbose : log출력의 레벨을 조정한다.
grid = GridSearchCV(estimator = SVC(), param_grid, refit = True,
verbose = 4)
# X와 y로 학습 시킨다.
grid.fit(X_train, y_train)

# 가장 좋은 조합의 인공지능을 가져오는 코드
>>> best_classifier = grid.best_estimator_
# 가장 좋은 모델에 사용된 하이퍼 파라미터는 ??
>>> grid.best_params_
{'C': 0.1, 'gamma': 1, 'kernel': 'poly'}
# X_train, y_train으로 학습했을때의 accuracy
>>> grid.best_score_
0.9780219780219781
'Python > Machine Learning' 카테고리의 다른 글
| 문자열 데이터를 숫자로 바꿔주는 CountVectorizer 와 analyzer 파라미터, fit, transform (0) | 2022.05.11 |
|---|---|
| 문자열 데이터의 구두점과 Stopwords(불용어) 제거하기 (0) | 2022.05.11 |
| Hierachical Clustering과 Dendrogram (0) | 2022.05.10 |
| sklearn라이브러리를 이용한 K-Means의 WCSS와 Elbow Method (0) | 2022.05.10 |
| 스케일러나 인코더의 fit(), transform(), fit_transform() 함수 사용법 (0) | 2022.05.10 |