안녕하세요.
현재 로지스틱 회귀분석을 하려고 하는 상황이고, 독립변수들과 종속변수는 준비해 둔 상태입니다.
다만 독립변수들 중 categorical 변수들이 있어서 labelbinarizer
를 통해 변환을 하였습니다.
사용한 코드는 다음과 같아요
import statsmodels.api as sm
# (X와 y에는 데이터와 타겟변수가 잘 들어가 있습니다.)
X = ~~~~~~~~~~~~~
y = ~~~~~~~~~~~~~
results = sm.OLS(y, X).fit()
print(results.summary())
라고 출력하면 제대로 results
가 출력은 되는데
제가 넣은 독립변수는 7개인데 결정계수는 10개가 나옵니다.
왜 그런건가요?
혹시 이것 때문인지는 모르겠으나, 현재 제가 가진 독립변수 중 categorical 변수는 2개이며 각각 A, B와 a, b, c, d로 분리되어 있습니다.