| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- DataFrame
- 분류 결과표
- 반복문
- IN
- Machine Learning
- wcss
- elbow method
- Python
- 덴드로그램
- hierarchical_clustering
- sklearn
- del
- count()
- list
- append()
- string
- analizer
- dendrogram
- DataAccess
- 최댓값
- insert()
- len()
- numpy
- matplotlib
- pandas
- data
- 최솟값
- nan
- Dictionary
- function
- Today
- Total
목록Python (54)
개발공부
numpy에선 delete()를 사용해 항목을 삭제할 수 있다. >>> x array([17, 7, 19, 17, 6, 4, 15]) # 3번 인덱스를 삭제하기 >>> x = np.delete(x, 3) >>> x array([17, 7, 19, 6, 4, 15]) # 1, 5번 인덱스 삭제하기 >>> np.delete(x, [1, 5])#삭제할 인덱스가 2개 이상이면, 리스트에 담아서 처리 array([17, 19, 6, 4]) 다차원은 축을 기준으로 삭제가 가능 >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) >>> np.delete(X, 1) array([36, 62, 17..
아래와 같은 넘파이 어레이가 있을때 , 최댓값 인덱스와, 최솟값 인덱스를 알아보자 >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 최댓값이 들어있는 곳의 인덱스 찾기 >>> X.argmax() 14 최솟값이 들어있는 곳의 인덱스 찾기 >>> X.argmin() 11 각 행별로 최댓값의 인덱스 구하기 >>> X.argmax(axis = 1) array([1, 4, 4, 1], dtype=int64) 각 열별로 최댓값의 인덱스 구하기 >>> X.argmin(axis = 0) array([2, 2, 2, 3, 3], dtype=int64)
아래와 같은 2차원 배열 X 가있을 때 다음과 같은 조건을 만족하는 값을 구할 수 있다. 조건을 X[조건]에 넣으면 그에 맞는 값으로 이루어진 넘파이 어레이를 생성한다. >>>X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 1. X 에 70보다 큰 데이터는 몇개가 있나요? >>> X > 70 array([[False, False, False, False, False], [False, False, False, False, True], [False, False, False, True, True], [False, False, False, False, False]]) >>> (X > 70).s..
아래와 같은 2차원 배열 X가 있다고 하자 >>> X = np.random.randint(1, 100, (4,5)) >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 최댓값 구하기 - max() >>> X.max() 97 최솟값 구하기 = min() >>> X.min() 1 전체 합 구하기 - sum() >>> X.sum() 788 전체 평균 구하기 - mean() >>> X.mean() 39.4 표준편차 구하기 - std() >>> X.std() 28.805207862468205 중앙값 구하기 - median() >>> np.median(X) 40.5 행이나 열별로 등을 구하려면..
NUMPY NumPy는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리입니다. - 다음이 실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치합니다. 넘파이는 아래와 같이 선언하여 사용할 수 있다. import numpy as np 넘파이 어레이 생성 np.array() >>> a = [1, 2, 3, 4, 5] >>> b = np.array(a) >>> b array([1, 2, 3, 4, 5]) >>> b = np.array([[1,2],[3,4]]) >>> b array([[1, 2], [3, 4]]) >>> b.size #(총 데이터의 개수) 4 >>> len(b) 2 >>> b.shape # (행의 개수, 열의 개수) (2, 2)..
relativedelta를 이용하면 날짜의 연산이 가능하다. from dateutil.relativedelta import relativedelta 예제 1. 현재 시간에서 26일 뒤는 언제인가 ? >>> today = datetime.today() >>> print(today) 2022-04-27 18:25:50.196321 >>> goal_day = today + relativedelta(days = +26) >>> print(goal_day) 2022-05-23 18:25:50.196321 2. 현재시간에서 1년 3개월 5일 7시간 후의 시간은 ? >>> today = datetime.today() >>> print(today) 2022-04-27 18:25:50.196321 >>> goal_day..
dateutil.parser의 parse를 이용하면 문자열로 되어있는 날짜를 파이썬이 계산할 수 있도록 변경이 가능하다. from dateutil.parser import parse 기본 사용법은 아래와 같다. >>> date_str = '2022-05-08' >>> someday = parse(date_str) >>> someday datetime.datetime(2022, 5, 8, 0, 0) >>> someday.weekday() 6 >>> parse('2022/06/30') datetime.datetime(2022, 6, 30, 0, 0)
파이썬의 내장 모듈인 time 모듈은 UTC(GMT+0) 기준으로 1970년 1월 1일 0시 0분 0초부터의 경과 시간을 나타내는데 흔히 timestamp라고 불리기도 합니다. UTC 현재시각 time.gmtime()으로 알 수 있다. >>> import time >>> time.gmtime() time.struct_time(tm_year=2022, tm_mon=4, tm_mday=27, tm_hour=9, tm_min=10, tm_sec=56, tm_wday=2, tm_yday=117, tm_isdst=0) local 시각 - 우리나라 기준 시각 time.localtime()으로 알 수 있다. >>> import time >>> time.localtime() time.struct_time(tm_year..
랜덤(Random) 라이브러리(함수들의 집합)는 random을 import하여 사용할 수 있다. import random 랜덤(Random) 라이브러리의 함수 랜덤라이브러리의 함수는 random.함수이름() 과 같은식으로 사용할 수 있다. random.random() - 0 ~ 1 사이의 실수 값을 무작위로 가져온다. >>> random.random() 0.7000956306402929 random.randint(num1, num2) - num1 이상 num2 이하의 정수형 난수를 얻는다. >>> random.randint(100, 500) 432 random.uniform(num1, num2) - num1 이상 num2 이하의 실수형 난수를 얻는다. >>> random.uniform(1, 6) 3.94..
List Comprehension - 원본 리스트를 가지고, 다른 리스트를 만드는 방법이다. - for, while 없이 loop를 실행시키는 아름다운 방법이다. 예제 아래 for 문으로 만든 각리스트의 숫자를 7씩 뺀 리스트를 만드는 예제가 있다. >>> score_list = [ 88, 76, 56, 91, 68 ] >>> new_list = [] >>> for data in score_list : >>> new_list.append( data - 7 ) >>> new_list [81, 69, 49, 84, 61] 이를 list comprehension을 이용하면 아래와 같은 식으로 표현할 수 있다. >>> score_list = [ 88, 76, 56, 91, 68 ] >>> new_list = [..