1. 정형 데이터 분석 - 앙상블(ensemble) : 배깅(bagging)

코딩베어 ㅣ 2023. 5. 16. 16:00

728x90

앙상블이란 여러 동일한 종류나 상이한 모형들의 예측 또는 분류 결과를 종합하여, 최종적인 의사결정에 반영하는 기법이다.

1. 배깅(bagging) : 배깅은 훈련 데이터에서 다수의 부트스트랩(bootstrap) 자료를 생성해, 각 자료를 모델링한 후 결합하여, 최종 예측 모형을 만드는 것이다.

bagging(formula, data, mfinal, control) : mfinal - 반복수 또는 트리의 수(기본 100), control - 의사결정나무 옵션

library(mlbench)
PimaIndiansDiabetes2 = na.omit(PimaIndiansDiabetes2) #결측값 제거

train_idx = sample(1:nrow(PimaIndianDiabetes2),
                   size = 2/3 * nrow(PimaIndianDiabetes2)) #데이터 2/3을 학습 데이터로 사용
train = PimaIndiansDiabetes[train_idx,]
test = PimaIndiansDiabetes[-train_idx,]

library(ipred) #bagging 함수를 사용하기 위한 라이브러리 불러오기

md.bagging = bagging(diabetes~.,
                     data = train,
                     nbagg = 25) #배깅 모델 생성
                        
pred = predict(md.bagging, test)

library(caret) #혼동행렬을 사용하기 위한 라이브러리 불러오기
confusionMatrix(as.factor(pred),
                refernece = test$diabetes,
                positive = "pos")

728x90

저작자표시 비영리 변경금지 (새창열림)

'BAE(Certification)' 카테고리의 다른 글

1. 정형 데이터 분석 - 앙상블(ensemble) : 랜덤 포레스트(random forest) (0)	2023.05.16
1. 정형 데이터 분석 - 앙상블(ensemble) : 부스팅(boosting) (0)	2023.05.16
1. 정형데이터 분석 - 나이브 베이즈(Naive Bayes) 분류 (0)	2023.05.16
1. 정형데이터 분석 - KNN(K-Nearest Neighbor) (0)	2023.05.16
1. 정형데이터 분석 - 서포트 벡터 머신(SVM, Support Vector Machine) (0)	2023.05.16

코딩하는 곰의 일상 저장소

1. 정형 데이터 분석 - 앙상블(ensemble) : 배깅(bagging)

'BAE(Certification)' 카테고리의 다른 글

티스토리툴바