| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- numpy
- del
- DataAccess
- Python
- hierarchical_clustering
- pandas
- data
- DataFrame
- wcss
- function
- len()
- 최댓값
- insert()
- list
- count()
- 반복문
- 최솟값
- string
- analizer
- append()
- Dictionary
- IN
- Machine Learning
- 덴드로그램
- dendrogram
- matplotlib
- elbow method
- nan
- 분류 결과표
- sklearn
- Today
- Total
목록Python/Pandas (14)
개발공부
df 인덱스명 변경 # store 3 를 last store 로변경하기 df.rename( index = {'store 3' : 'last store'} ) 컬럼명 변경 # bikes 컬럼을 hat 으로 바꾸고, suits 컬럼은 shoes 로 바꾸기 df.rename ( columns= {'bikes' : 'hat', 'suits' : 'shoes'}) 컬럼을 인덱스로 사용 set_index() df # name 컬럼을 인덱스로 사용하고 싶을 때 # set_index()를 사용한다 # inplace = True => 원본 데이터 변경 여부 df.set_index('name', inplace = True) df 사용했던 컬럼을 원래대로 되돌리기 reset_index() df.reset_index(inpl..
Pandas Dataframe 새로운 컬럼 생성 df df['shirts'] = [15, 2] df # pants 컬럼의 데이터와 shirts 컬럼의 데이터를 합해서, suits 컬럼을 만들기 df['pants'] + df['shirts'] df['suits'] = df['pants'] + df['shirts'] df 새로운 열 생성 append() # 새로 추가할 데이터 프레임을 만든다 new_item = [{'bikes':20, 'pants':30, 'watches':35, 'glasses':4}] new_store = pd.DataFrame(data = new_item, index= ['store 3']) new_store # 새로운 데이터인 store 3 를 원래 데이터 df에 추가한다. df =..
Pandas Dataframe 생성 >>> import pandas as pd # 딕셔너리 형태로 만들기 >>> items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])} >>> df = pd.DataFrame(data= items) >>> df 왼쪽 진한 글자가 인덱스 위쪽 진한 글자는 컬럼 안에 있는 데이터는 밸류 NaN 은 해당 항목에 값이 없음을 뜻한다. (Not a Number) (numpy.nan 과 같다.) >>> df.index I..
Pandas 장점 - Allows the use of labels for rows and columns - 기본적인 통계데이터 제공 - NaN values 를 알아서 처리함. - 숫자 문자열을 알아서 로드함. - 데이터셋들을 merge 할 수 있음. - It integrates with NumPy and Matplotlib Pandas Series 데이터 생성 >>> import pandas as pd >>> index = ['eggs', 'apples', 'milk', 'bread'] >>> data = [30, 6, 'Yes', 'No'] # data로 만들기 >>> x = pd.Series(data = data) >>> x 0 30 1 6 2 Yes 3 No dtype: object # data와,..