일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- analizer
- hierarchical_clustering
- 최솟값
- IN
- DataFrame
- Machine Learning
- len()
- append()
- string
- insert()
- list
- count()
- 최댓값
- 분류 결과표
- del
- wcss
- elbow method
- Dictionary
- dendrogram
- pandas
- Python
- numpy
- nan
- sklearn
- matplotlib
- 반복문
- DataAccess
- 덴드로그램
- function
- data
- Today
- Total
목록Python/Numpy (10)
개발공부

Numpy 시간 처리 방법 np.datetime64 기존의 파이썬 datetime 을 보강하기 위해, date 의 array 도 처리할 수 있게 numpy 에서 64-bit 로 처리하도록 라이브러리를 강화했다. 생성은 아래와 같이 할 수 있다. >>> import numpy as np >>> any_date = np.array('2022-05-11', dtype = np.datetime64) >>> any_date array('2022-05-11', dtype='datetime64[D]') 날짜 연산 넘파이의 datetime64는 날짜 연산이 단순하게 + - 연산자를 이용하면 돼서 간편하다. >>> any_date + 10 numpy.datetime64('2022-05-21') >>> any_date -..

1차원 배열 연산 위치에 매치되는 데이터끼리 연산한다. >>> x = np.random.randint(1, 10, 4) >>> y = np.random.randint(10, 100, 4) >>> x array([1, 3, 2, 6]) >>> y array([91, 80, 29, 80]) >>> x + y array([92, 83, 31, 86]) >>> x - y array([-90, -77, -27, -74]) >>> x * y array([ 91, 240, 58, 480]) >>> x / y array([0.01098901, 0.0375 , 0.06896552, 0.075 ]) 2차원 배열 연산 위치에 매치되는 데이터끼리 연산한다. >>> X = np.random.randint(1, 10, (2,2)..

np.unique() -중복된 값을 제거한다. - set과 유사한 기능을 한다. >>> x = np.array([1, 5, 3, 1, 40, 22, 33, 56, 12, 1, 5, 3]) >>> x array([ 1, 5, 3, 1, 40, 22, 33, 56, 12, 1, 5, 3]) >>> np.unique(x) array([ 1, 3, 5, 12, 22, 33, 40, 56])

항목을 끝에 추가하기 np.append() >>> x = np.array([17, 7, 19, 6, 4, 15]) >>> x array([17, 7, 19, 6, 4, 15]) # 끝에 100을 추가하기 >>> np.append(x, 100) array([ 17, 7, 19, 6, 4, 15, 100]) # 끝에 200, 300, 350 추가하기 >>> np.append(x, [200, 300, 350])# 리스트 형태로 추가한다. array([ 17, 7, 19, 6, 4, 15, 200, 300, 350]) # 각 행의 끝에 b 어레이의 요소를 하나씩 추가하기 # append()의 axis = 1로 설정 >>> X = np.array([[36, 66, 62, 17, 50], [58, 47, 6, 45..

numpy에선 delete()를 사용해 항목을 삭제할 수 있다. >>> x array([17, 7, 19, 17, 6, 4, 15]) # 3번 인덱스를 삭제하기 >>> x = np.delete(x, 3) >>> x array([17, 7, 19, 6, 4, 15]) # 1, 5번 인덱스 삭제하기 >>> np.delete(x, [1, 5])#삭제할 인덱스가 2개 이상이면, 리스트에 담아서 처리 array([17, 19, 6, 4]) 다차원은 축을 기준으로 삭제가 가능 >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) >>> np.delete(X, 1) array([36, 62, 17..

아래와 같은 넘파이 어레이가 있을때 , 최댓값 인덱스와, 최솟값 인덱스를 알아보자 >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 최댓값이 들어있는 곳의 인덱스 찾기 >>> X.argmax() 14 최솟값이 들어있는 곳의 인덱스 찾기 >>> X.argmin() 11 각 행별로 최댓값의 인덱스 구하기 >>> X.argmax(axis = 1) array([1, 4, 4, 1], dtype=int64) 각 열별로 최댓값의 인덱스 구하기 >>> X.argmin(axis = 0) array([2, 2, 2, 3, 3], dtype=int64)

아래와 같은 2차원 배열 X 가있을 때 다음과 같은 조건을 만족하는 값을 구할 수 있다. 조건을 X[조건]에 넣으면 그에 맞는 값으로 이루어진 넘파이 어레이를 생성한다. >>>X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 1. X 에 70보다 큰 데이터는 몇개가 있나요? >>> X > 70 array([[False, False, False, False, False], [False, False, False, False, True], [False, False, False, True, True], [False, False, False, False, False]]) >>> (X > 70).s..

아래와 같은 2차원 배열 X가 있다고 하자 >>> X = np.random.randint(1, 100, (4,5)) >>> X array([[36, 66, 62, 17, 50], [58, 47, 6, 45, 72], [11, 1, 2, 85, 97], [12, 64, 21, 3, 33]]) 최댓값 구하기 - max() >>> X.max() 97 최솟값 구하기 = min() >>> X.min() 1 전체 합 구하기 - sum() >>> X.sum() 788 전체 평균 구하기 - mean() >>> X.mean() 39.4 표준편차 구하기 - std() >>> X.std() 28.805207862468205 중앙값 구하기 - median() >>> np.median(X) 40.5 행이나 열별로 등을 구하려면..

파이썬에서 1차원 배열은 백터(Vector), 2차원 배열은 행렬(Matrix)와 같은 의미로 쓰인다. 우리는 1차원 배열을 얻은 후, 이를 가지고 여러 차원으로 만들 수 있는데 이때 쓰이는 함수가 reshape이다. reshape() - 넘파이 어레이를 다른 차원의 형태로 바꿀 수 있다. - 데이터의 총 갯수가 일치해야 한다. >>> import numpy as np >>> x = np.arange(20) array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]) >>> x.shape (20,) >>> x.ndim # x의 차원 수를 알려줌 1 # 위의 x를 2차원 (4, 5)의 형태를 가진 X로 변경하라. >>> X =..

NUMPY NumPy는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리입니다. - 다음이 실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치합니다. 넘파이는 아래와 같이 선언하여 사용할 수 있다. import numpy as np 넘파이 어레이 생성 np.array() >>> a = [1, 2, 3, 4, 5] >>> b = np.array(a) >>> b array([1, 2, 3, 4, 5]) >>> b = np.array([[1,2],[3,4]]) >>> b array([[1, 2], [3, 4]]) >>> b.size #(총 데이터의 개수) 4 >>> len(b) 2 >>> b.shape # (행의 개수, 열의 개수) (2, 2)..