일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- sklearn
- Machine Learning
- append()
- DataFrame
- wcss
- nan
- 반복문
- insert()
- data
- del
- hierarchical_clustering
- matplotlib
- analizer
- len()
- 최솟값
- Python
- numpy
- 덴드로그램
- 최댓값
- Dictionary
- count()
- DataAccess
- string
- dendrogram
- IN
- elbow method
- pandas
- function
- 분류 결과표
- list
- Today
- Total
목록nan (2)
개발공부

학습을 위해 데이터를 Train과 Test 영역으로 나눠보자. 아래와 같은 데이터 프레임이 있다. 먼저 해당데이터에 Nan이 있으면 나중에 학습을 하는데 문제가 발생하니 여러가지 방법으로 Nan을 처리해야 한다. 먼저 데이터에 Nan이 있는지 확인해보자. >>> df.isna().sum() Country 0 Age 1 Salary 1 Purchased 0 dtype: int64 Age 컬럼과 Salary에 각 1개의 Nan이 있는 것을 확인할 수 있다. 이를 처리 해보자. Nan이 있는 행 삭제 dropna() df = df.dropna() df dropna()를 해서 Nan이 있는 행을 삭제할 수 있다. Nan을 각 컬럼의 평균 값으로 변경 df[ 컬럼명 ].fillna( df[ 컬럼명 ].mean()..

items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'shoes':5, 'suits':7}, {'bikes': 20, 'pants': 30, 'watches': 35, 'glasses': 4, 'shoes':10}] df = pd.DataFrame(data = items2, index = ['store 1', 'store 2', 'store 3']) df NaN 이 얼마나 있는지 파악 isna() df.isna() # 각 컬럼별로 NaN의 수 df.isna().sum() # 총..