[작업형2] 입학여부 확률 구하기

코딩베어 ㅣ 2023. 6. 20. 17:32

728x90

x_train = read.csv("C:/BigDataCertificationCourses-main/3rd/t2-2-X_train.csv", header=T)
x_test = read.csv("C:/BigDataCertificationCourses-main/3rd/t2-2-X_test.csv", header=T)
y_train = read.csv("C:/BigDataCertificationCourses-main/3rd/t2-2-Y_train.csv", header=T)
summary(x_train)
summary(x_test)
summary(y_train)

df.train = as.data.frame(merge(x_train, y_train)) #train 데이터 합치기
summary(df.train)

library(caret)
idx = caret::createDataPartition(df.train[,1],
                           times = 1,
                           p = 0.8)
train = df.train[idx$Resample1,]
test = df.train[-idx$Resample1,]

library(randomForest)
md.rf = randomForest(Chance.of.Admit ~ .,
                     data = train)

md.lm = lm(Chance.of.Admit ~ .,
           data = train)

pred.rf = predict(md.rf, newdata = test) #테스트 데이터로 모델 정확도 확인
pred.lm = predict(md.lm, newdata = test)
rmse = rmse(test$Chance.of.Admit, pred.rf)
rmse
rmse2 = rmse(test$Chance.of.Admit, pred.lm)
rmse2
#random forest 모델의 RMSE 값이 더 우수하므로 예측 모델로 적용

pred = predict(md.rf, newdata = x_test)

final_data = cbind(x_test$Serial.No.,pred) #결과값 예측 저장 
colnames(final_data) = c("id", "target")
final_data

728x90

저작자표시 비영리 변경금지

'BAE(Certification) > [작업형2] 정형데이터 분석' 카테고리의 다른 글

[작업형2] 중고차 가격 예측하기 : 22년 5회 기출 (0)	2023.06.21
[작업형2] 자동차 시장 세분화 : 22년 4회 기출 (0)	2023.06.21
[작업형2] PimaIndiansDiabetes2 데이터 연습 (0)	2023.06.20
[작업형2] 서비스 이탈예측 데이터 분석 : 4모델 만들기(빅분기 작업형2 실전대비) (0)	2023.06.20
[작업형2] Travel Insurance : 21년 3회 기출 (0)	2023.05.25

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

코딩하는 곰의 일상 저장소

[작업형2] 입학여부 확률 구하기

'BAE(Certification) > [작업형2] 정형데이터 분석' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역