728x90

회귀분석은 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정

 

lm(formula, data) : formula 종속변수 ~ 독립변수(다중 회귀인 경우, 여러개)

first_model = lm(Salary ~ AtBat + Hits + Walks + Cwalks + Division + PutOuts, data = hitters)
fit_model = step(first_model, direction = "backward") #후진소거법으로 모델에 적합한 변수선택
vif(fit_model) #다중공선성 확인 vif결과가 10이상이면 다중공선성 문제가 심각

second_model = lm(Salary ~ Hits + Cwalks + Division + PutOuts, data = hitters)
vif(second_model) #다중공선성이 해결되었음
summary(second_model) #F통계량 확인(높을 수록 유의), p값 확인(유의 수준 0.05안으로 되면 귀무가설 기각, 대립가설 채택)

 

728x90