Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- count()
- DataAccess
- list
- matplotlib
- Machine Learning
- DataFrame
- elbow method
- nan
- Python
- len()
- string
- analizer
- del
- wcss
- 반복문
- 최솟값
- dendrogram
- 분류 결과표
- numpy
- sklearn
- IN
- 최댓값
- function
- pandas
- append()
- insert()
- hierarchical_clustering
- 덴드로그램
- Dictionary
- data
Archives
- Today
- Total
목록labelencoding (1)
개발공부
데이터 분리하기 #1 과 #2에서 우리는 X와 y를 구했다. 우리는 컴퓨터에게 학습을 시켜야 하기 때문에 숫자가 아닌 데이터중에, 카테고리컬 데이터로 판단되는 데이터는 숫자로 바꿔주는 작업이 필요하다. X의 Country와 y의 데이터가 카테고리컬 데이터인지 확인하고 이를 숫자로 바꿔주는 작업을 해보겠다. >>> X['Country'].nunique() 3 >>> sorted (X['Country'].unique()) ['France', 'Germany', 'Spain'] Country의 데이터들은 ['France', 'Germany', 'Spain']로만 이루어진 카테고리컬 데이터라는 것을 확인할 수 있다. 이를 숫자로 바꾸는 방법 두가지를 알아보자. 1. Label Encoding (레이블 인코딩) ..
Python/Machine Learning
2022. 5. 6. 18:08