| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- hierarchical_clustering
- count()
- list
- 반복문
- append()
- data
- matplotlib
- nan
- function
- IN
- DataFrame
- del
- 최솟값
- Machine Learning
- 최댓값
- pandas
- insert()
- 분류 결과표
- Dictionary
- 덴드로그램
- analizer
- DataAccess
- wcss
- string
- numpy
- dendrogram
- elbow method
- Python
- sklearn
- len()
- Today
- Total
목록data (2)
개발공부
https://mscha.tistory.com/68 [Machine Learning] 데이터 분리하기 #1 Nan처리하기 학습을 위해 데이터를 Train과 Test 영역으로 나눠보자. 아래와 같은 데이터 프레임이 있다. 먼저 해당데이터에 Nan이 있으면 나중에 학습을 하는데 문제가 발생하니 여러가지 방법으로 Nan을 처리 mscha.tistory.com 데이터 분리하기 #1 에서 Nan을 dropna()하는 방식으로 데이터프레임을 가공하여 아래와 같은 df를 얻었다. 우리가 원하는 것은 Country, Age, Salary에 따라 Purchased가 Yes인지 No인지를 예측하는 것이다. Country, Age, Salary를 학습데이터 X Purchased를 그에 따른 레이블 y로 만들어 보겠다. X ..
Dictionary - my_dict = {'key1':'value1', 'key2':'value2', 'key3':'value3'} - 딕셔너리는 키 밸류의 쌍으로 되어 있다. - 한쌍 : item 아이템 - 아이템의 왼쪽 : key 키 - 아이템의 오른쪽 : value 밸류 - 키는, 딕셔너리 안에 유일한 값으로 되어 있다. 따라서 키가 같은 값을 가질 수 없다. 그러나 밸류는 같은 값이 여러개 있어도 상관없다. - 리스트는 인덱스의 오프셋으로 접근하지만, 딕셔너리는 키로 접근한다. - { }, dict() 로 생성 가능하다. Data access - 딕셔너리의 데이터 억세스는 인덱스가 아니라 '키'로 억세스한다. - 없는 키값에 억세스하면 KeyError가 발생한다. - get() 를 사용해도 데이..