파이썬 다중회귀선형모델 질문드려요.

조회수 917회

-회귀모델 자료 csv파일 링크입니다!

https://drive.google.com/file/d/1P1IAq7q-3u8C6CyQoFCiuCch9eh3bn60/view?usp=sharing

이 자료로 회귀모델을 만드는 중인데 파이썬이 처음이다보니 잘 모르겠어서 질문드립니다. 이 자료를 보면 x_0 x_1 x_2 x가 3개이므로 다중회귀인건가요? 아니면 그냥 회귀모델인건가요? 그리고 다중회귀분석같은경우 자료를 시각자료로 만들지않고 바로 모델링을 하는건가요? 저 자료로 회귀모델 만드려고 하는데 조금이라도 팁이나 가르침 부탁드려요.

1 답변

  • https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html

    선형회귀 공부하시고, 위 문서를 한번 보세요. 일반 머신러닝은 scikit-learn 이 간단하고 좋습니다. 문서도 잘 되어 있습니다.

    간단한 선형회귀 예제코드는

    import pandas as pd
    from sklearn.linear_model import LinearRegression
    
    # read data and set X and y
    df = pd.read_csv('test.csv')
    
    print(df.info())
    print(df.head())
    
    X = df[['x_0', 'x_1', 'x_2']]
    y = df['y']
    
    # regression using sklearn lin-reg model
    reg = LinearRegression()
    reg.fit(X, y)
    print(reg.coef_)
    print(reg.intercept_)
    

    실행결과

    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 200 entries, 0 to 199
    Data columns (total 5 columns):
     #   Column      Non-Null Count  Dtype
    ---  ------      --------------  -----
     0   Unnamed: 0  200 non-null    int64
     1   x_0         200 non-null    float64
     2   x_1         200 non-null    float64
     3   x_2         200 non-null    float64
     4   y           200 non-null    float64
    dtypes: float64(4), int64(1)
    memory usage: 7.9 KB
    None
       Unnamed: 0       x_0       x_1       x_2          y
    0           0 -1.774915  0.627609  0.320547  44.371864
    1           1 -0.433889 -0.271014 -0.726314 -52.123380
    2           2 -2.132202 -0.329896  2.034855   5.649362
    3           3 -2.368874  0.282574 -1.004728 -41.428106
    4           4  1.089158  0.624181 -0.427276  61.875930
    [16.38626013 92.78638947 33.74001825]
    4.139570957198153
    

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)