Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 분류 결과표
- IN
- DataAccess
- string
- pandas
- dendrogram
- Machine Learning
- count()
- wcss
- DataFrame
- del
- list
- analizer
- 최댓값
- elbow method
- len()
- matplotlib
- append()
- nan
- Dictionary
- 반복문
- data
- 덴드로그램
- Python
- numpy
- hierarchical_clustering
- function
- sklearn
- insert()
- 최솟값
Archives
- Today
- Total
개발공부
Time Series 데이터를 처리할 때 사용하는 resample 함수 본문
groupby() 로는 년, 월, 일, 시, 분, 초 단위 등으로 묶을 수 없다.
resample() 함수는 이를 가능하게 해준다.
먼저 Date 컬럼을 인덱스로 만들어주면 resample 함수를 사용할 수 있게 된다.
이 함수를 통해 년, 월, 일, 시 등등으로 묶어서 처리가 가능해 진다.
아래와 같은 데이터 프레임이 있다.
시카고 에서 일어난 범죄에 대한 데이터이다.
이 데이터 프레임의 인덱스를 Date 로 바꿔준다.
# 해당 컬럼은 그대로 놔두고 인덱스로도 사용
chicago_df.index = chicago_df['Date']
chicago_df
이제 resample() 을 이용해보자
년도로 리샘플한 후, 년도별 몇개의 범죄 데이터를 가지고 있는지 확인하기
df_year = chicago_df.resample('YS').size()
df_year
월별 범죄 발생 건수를 확인하기
df_month = chicago_df.resample('M').size()
df_month
분기별 범죄 건수 확인하기
df_q = chicago_df.resample('Q').size()
df_q
'Python > Pandas' 카테고리의 다른 글
Pandas Series 의 dt 속성 사용법 (0) | 2022.05.12 |
---|---|
pandas.read_csv 함수의 error_bad_lines=False 파라미터 사용법 (0) | 2022.05.12 |
[Python] Pandas 에서 시간 처리 [생성(datetimeIndex() , to_datetime()), 연산, 인덱싱] (0) | 2022.05.06 |
[Python] Pandas pivot_table() 생성하기 (0) | 2022.05.04 |
[Python] Pandas Dataframe 합치기 concat(), merge() (0) | 2022.05.03 |