Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- 덴드로그램
- DataFrame
- sklearn
- string
- Python
- data
- 최솟값
- insert()
- len()
- elbow method
- 최댓값
- function
- numpy
- count()
- DataAccess
- IN
- matplotlib
- 분류 결과표
- 반복문
- dendrogram
- nan
- pandas
- list
- del
- analizer
- append()
- wcss
- Dictionary
- hierarchical_clustering
- Machine Learning
Archives
- Today
- Total
개발공부
[Machine Learning] 신규 데이터 예측하는 순서 본문
Multiple Linear Regression 실습 예제
아래처럼, 여러개의 features 를 기반으로, 수익을 예측하려 한다. 위와 같이, 여러개의 변수들을 통해, 수익과의 관계를 분석하고 이를 통해, 새로운 데이터가 들어왔을 때, 수익이 어떻게 될
mscha.tistory.com
위에서 만든 인공지능을 이용해 신규 데이터 예측을 해보자.
df.head()

R&D Spend = 220000, Administration = 190000, Maketing Spend = 500000이고,
State = Florida 일 때 Profit을 예측하는 경우를 구해보자.
1. 일단 넘파이 어레이로 새로운 데이터를 만든다.
new_data = np.array ( [220000, 190000, 500000, 'Florida'] )
2. 넘파이 어레이의 shape을 맞춰준다. (X_train과 동일하게)
>>> X_train.shape
(40, 6)
>>> new_data.shape
(4,)
>>> new_data = new_data.reshape(1, 4)
>>> new_data
array([['220000', '190000', '500000', 'Florida']], dtype='<U11')
3. 레이블 인코딩이나 원핫인코딩이 필요하면, 인공지능을 만들때 사용한 인코더를 사용해야 한다.
>>> new_data = ct.transform(new_data)
>>> new_data
array([['0.0', '1.0', '0.0', '220000', '190000', '500000']], dtype='<U32')
>>> X_train.shape
(40, 6)
>>> X_test.shape
(10, 6)
>>> new_data.shape
(1, 6)
4. 만약 데이터가 float 이 아니면, float 으로 데이터를 바꿔준다.
>>> new_data = new_data.astype(float)
5. 예측 함수인, predict를 호출한다.
>>> regressor.predict(new_data)
array([240408.7230178])'Python > Machine Learning' 카테고리의 다른 글
| sklearn라이브러리를 이용한 K-Means의 WCSS와 Elbow Method (0) | 2022.05.10 |
|---|---|
| 스케일러나 인코더의 fit(), transform(), fit_transform() 함수 사용법 (0) | 2022.05.10 |
| sklearn 라이브러리의 분류 결과표 Confusion Matrix (분류 문제의 인공지능 성능 평가 방법) (0) | 2022.05.09 |
| Multiple Linear Regression 실습 예제 (0) | 2022.05.09 |
| Linear Regression (0) | 2022.05.09 |