편집 기록

편집 기록
  • 프로필 nowp님의 편집
    날짜2019.06.11

    statsmodels.api에 대해 질문드려요


    안녕하세요.

    현재 로지스틱 회귀분석을 하려고 하는 상황이고, 독립변수들과 종속변수는 준비해 둔 상태입니다.

    다만 독립변수들 중 categorical 변수들이 있어서 labelbinarizer를 통해 변환을 하였습니다.

    사용한 코드는 다음과 같아요

    import statsmodels.api as sm
    
    # (X와 y에는 데이터와 타겟변수가 잘 들어가 있습니다.)
    
    X = ~~~~~~~~~~~~~
    y = ~~~~~~~~~~~~~
    
    results = sm.OLS(y, X).fit()
    
    print(results.summary())
    

    라고 출력하면 제대로 results가 출력은 되는데 제가 넣은 독립변수는 7개인데 결정계수는 10개가 나옵니다.

    왜 그런건가요?

    혹시 이것 때문인지는 모르겠으나, 현재 제가 가진 독립변수 중 categorical 변수는 2개이며 각각 A, B와 a, b, c, d로 분리되어 있습니다.

  • 프로필 알 수 없는 사용자님의 편집
    날짜2019.06.11

    statsmodels.api에 대해 질문드려요


    안녕하세요.

    현재 로지스틱 회귀분석을 하려고 하는 상황이고, 독립변수들과 종속변수는 준비해 둔 상태입니다.

    다만 독립변수들 중 categorical 변수들이 있어서 labelbinarizer를 통해 변환을 하였습니다.

    사용한 코드는 다음과 같아요

    import statsmodels.api as sm

    (X와 y에는 데이터와 타겟변수가 잘 들어가 있습니다.)

    X = ~~~~~~~~~~~~~

    y = ~~~~~~~~~~~~~

    results = sm.OLS(y, X).fit()

    print(results.summary())

    라고 출력하면 제대로 results가 출력은 되는데 제가 넣은 독립변수는 7개인데 결정계수는 10개가 나옵니다.

    왜 그런건가요?

    혹시 이것 때문인지는 모르겠으나, 현재 제가 가진 독립변수 중 categorical 변수는 2개이며 각각 A, B와 a, b, c, d로 분리되어 있습니다.