不同预测算法比较实例(R语言)

作者: 三猫后端 | 来源:发表于2019-02-13 21:25 被阅读3次

不同预测算法比较实例(R语言)
预测分析研究
R programming - WEEK4
R和Python数据结构对比
R语言机器学习与临床预测模型22--预测模型常用构建方法
R语言机器学习与临床预测模型25--净重新分类指数
R语言机器学习与临床预测模型28--决策曲线
R语言机器学习与临床预测模型30--主成分分析(PCA)
R语言机器学习与临床预测模型23--回归模型可视化
R语言机器学习与临床预测模型24--C-statistics&C

原文链接：不同预测算法比较实例(R语言)

微信公众号：机器学习养成记搜索添加微信公众号：chenchenwings

预测算法种类很多，不论是为实际问题选择更好的分类器，还是模型优化中判断模型效果，都需要比较不同算法之间的优劣。本文我们将借助样本数据，演示从数据处理－训练－预测－模型比较全流程的操作实例。

实例演示框架

此次我们使用的样本数据共538条，包括18个自变量和1个因变量组成。因变量取0时代表会发生异常，取1时代表不会发生异常。整体演示框架如下：

分步讲解

step1

导入数据后，观察y值的取值分布，发现整体样本较少，且正样本数与负样本数比例仅为4:10，因此需要扩充样本并进行正负样本平衡，这里我们使用SMOTE方法。

对数据扩充平衡后，使用LOF方法，删除异常点。根据下方异常值得分密度图，将得分超过3的点作为异常点剔除。

剔除后，数据分布如下：

step2

对处理后数据进行训练集与测试集划分，使用三种算法在训练集上构建分类器，在测试集上比较结果。

首先使用随机森林构建分类器。在构建随机森林分类器时，根据OBB误差最小选择合适的mtry值，再根据树的棵树与误差图选择合适的ntree值。

确定好参数后，训练最终分类器，并可得到变量重要性排序。

构建好随即森林分类器后，继续将逻辑回归及svm分类器构建完毕，然后将三个分类器分别对测试集进行预测。

step3

通过roc曲线比较三个分类器效果。在本例中，随即森林效果最好，逻辑回归效果最差。

完整代码

本例涉及到多个包，关于R语言包的安装方法可参见R语言包的安装。

公众号后台回复“ 实例”，可获得本例中数据及代码

推荐文章

· Bagging算法(R语言)

·静态爬虫与地址经纬度转换(python)

·特征工程(一):前向逐步回归(R语言)

·聚类(三):KNN算法(R语言)

·小案例(六)：预测小偷行为（python）

·ggplot2:正负区分条形图及美化

扫描二维码，关注我们。

如需转载，请在开篇显著位置注明作者和出处，并在文末放置机器学习养成记二维码和添加原文链接。

快来关注我们吧！

不同预测算法比较实例(R语言)
原文链接：不同预测算法比较实例(R语言) 微信公众号：机器学习养成记搜索添加微信公众号：chenchenwin...
预测分析研究
预测算法用java实现数学建模spss时间预测 Arima模型分析预测基于R语言的上海房价预测 R学习日记——...
R programming - WEEK4
参考文献 R语言实例-数据过滤grep正则表达式R 语言中，数据框依据不同列进行排序R语言rank函数详细解析R语...
R和Python数据结构对比
本文内容概要： R语言数据结构及实例操作 Python语言数据结构及实例操作 R语言数据结构及实例解析接下开始学...
R语言机器学习与临床预测模型22--预测模型常用构建方法
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...
R语言机器学习与临床预测模型25--净重新分类指数
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...
R语言机器学习与临床预测模型28--决策曲线
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...
R语言机器学习与临床预测模型30--主成分分析(PCA)
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...
R语言机器学习与临床预测模型23--回归模型可视化
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...
R语言机器学习与临床预测模型24--C-statistics&C
本内容为【科研私家菜】R语言机器学习与临床预测模型系列课程R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的...