statsmodels.api에 대해 질문드려요

조회수 583회

안녕하세요.

현재 로지스틱 회귀분석을 하려고 하는 상황이고, 독립변수들과 종속변수는 준비해 둔 상태입니다.

다만 독립변수들 중 categorical 변수들이 있어서 labelbinarizer를 통해 변환을 하였습니다.

사용한 코드는 다음과 같아요

import statsmodels.api as sm

# (X와 y에는 데이터와 타겟변수가 잘 들어가 있습니다.)

X = ~~~~~~~~~~~~~
y = ~~~~~~~~~~~~~

results = sm.OLS(y, X).fit()

print(results.summary())

라고 출력하면 제대로 results가 출력은 되는데 제가 넣은 독립변수는 7개인데 결정계수는 10개가 나옵니다.

왜 그런건가요?

혹시 이것 때문인지는 모르겠으나, 현재 제가 가진 독립변수 중 categorical 변수는 2개이며 각각 A, B와 a, b, c, d로 분리되어 있습니다.

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)