파이썬 다중회귀선형모델 질문드려요.
조회수 917회
-회귀모델 자료 csv파일 링크입니다!
https://drive.google.com/file/d/1P1IAq7q-3u8C6CyQoFCiuCch9eh3bn60/view?usp=sharing
이 자료로 회귀모델을 만드는 중인데 파이썬이 처음이다보니 잘 모르겠어서 질문드립니다.
이 자료를 보면 x_0
x_1
x_2
x가 3개이므로 다중회귀인건가요? 아니면 그냥 회귀모델인건가요?
그리고 다중회귀분석같은경우 자료를 시각자료로 만들지않고 바로 모델링을 하는건가요? 저 자료로 회귀모델 만드려고 하는데 조금이라도 팁이나 가르침 부탁드려요.
-
(•́ ✖ •̀)
알 수 없는 사용자 - 〉
1 답변
-
https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html
선형회귀 공부하시고, 위 문서를 한번 보세요. 일반 머신러닝은
scikit-learn
이 간단하고 좋습니다. 문서도 잘 되어 있습니다.간단한 선형회귀 예제코드는
import pandas as pd from sklearn.linear_model import LinearRegression # read data and set X and y df = pd.read_csv('test.csv') print(df.info()) print(df.head()) X = df[['x_0', 'x_1', 'x_2']] y = df['y'] # regression using sklearn lin-reg model reg = LinearRegression() reg.fit(X, y) print(reg.coef_) print(reg.intercept_)
실행결과
<class 'pandas.core.frame.DataFrame'> RangeIndex: 200 entries, 0 to 199 Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Unnamed: 0 200 non-null int64 1 x_0 200 non-null float64 2 x_1 200 non-null float64 3 x_2 200 non-null float64 4 y 200 non-null float64 dtypes: float64(4), int64(1) memory usage: 7.9 KB None Unnamed: 0 x_0 x_1 x_2 y 0 0 -1.774915 0.627609 0.320547 44.371864 1 1 -0.433889 -0.271014 -0.726314 -52.123380 2 2 -2.132202 -0.329896 2.034855 5.649362 3 3 -2.368874 0.282574 -1.004728 -41.428106 4 4 1.089158 0.624181 -0.427276 61.875930 [16.38626013 92.78638947 33.74001825] 4.139570957198153
댓글 입력