step1 线性回归ROC与AUC的实现
rm(list = ls())
# BiocManager::install('ROCR')
library(ROCR)
# 载入AER包,使用包中的Affairs数据集
# BiocManager::install('AER')
library(AER)
data(Affairs,package="AER")
# 将'affaris'特征进行因子化处理,作为新增加的一列'ynaffairs'
Affairs$ynaffair[Affairs$affairs > 0] <- 1
Affairs$ynaffair[Affairs$affairs== 0] <- 0
Affairs$ynaffair <-factor(Affairs$ynaffair,levels=c(0,1),labels=c("No","Yes"))
# 构建Logistics模型
myfit <- glm(ynaffair ~ gender + age + yearsmarried + children + religiousness + education + occupation + rating, data=Affairs,family=binomial())
pre <- predict(myfit,type='response')
pred <- prediction(pre,Affairs$ynaffair)
# 计算AUC值
performance(pred,'auc')@y.values
perf <- performance(pred,'tpr','fpr')
plot(perf)
这是计算affair的一个数据集
结果
summary(myfit) ### 得到拟合公式
拟合公式
step2 绘图强大的一个包——pROC
虽然ROCR包可以满足我们的需要,但在功能上还是有些单一,绘制的图也比较粗糙。因此接下来我们学习R中更为强大的一个包——pROC,该包不仅作图美观,还可以在同一幅图上绘制多条ROC曲线,方便我们比较两个分类器的性能优劣。
# BiocManager::install('pROC')
library(pROC)
# 同样使用上一节中的myfit模型
pre <- predict(myfit,type='response')
modelroc <- roc(Affairs$ynaffair,pre)
modelroc
# 可视化展示,同时给出AUC的面积与最优的临界点
plot(modelroc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2), grid.col=c("green", "red"), max.auc.polygon=TRUE, auc.polygon.col="skyblue", print.thres=TRUE)
结果2
step3 支持向量机法SVM
svm命令的R包 下载
svm命令的R包# 以下为之前的logistics模型
pre_1 <- predict(myfit,type='response')
modelroc_1 <- roc(Affairs$ynaffair,pre_1)
# 使用支持向量机算法对同样的数据进行预测
library(e1071) ###### 这个包里面有svm
svm_model <- svm(ynaffair ~ gender + age + yearsmarried + children + religiousness + education + occupation + rating, data=Affairs)
# 提取模型预测值并进行格式处理
pred_2 <- as.factor(svm_model$decision.values)
pred_2 <- as.ordered(pred_2)
modelroc_2 <- roc(Affairs$ynaffair,pred_2)
modelroc_2
# 可视化展示,使用add=TRUE将第二个模型添加到图形中
plot.roc(modelroc_2, add=TRUE, col="green",print.thres=TRUE)
plot(modelroc_1, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2), grid.col=c("green", "red"), max.auc.polygon=TRUE, auc.polygon.col="skyblue", print.thres=TRUE,col='blue')
plot.roc(modelroc_2, add=TRUE, col="green",print.thres=TRUE)
最终的结果
网友评论