python在Scikit-learn中用决策树和随机森林预测N

作者: 拓端tecdat | 来源:发表于2020-04-17 14:28 被阅读0次

python在Scikit-learn中用决策树和随机森林预测N
决策树与随机森林丨数析学院
用决策树和随机森林解决泰坦尼克号沉没问题
随机森林算法简介
在线作图|在线做随机森林分析
机器学习
随机森林-Python
Kaggle自行车预测练习-基础篇
sklearn-随机森林分类器
【实战篇】随机森林预测气温（一）

need-to-insert-img

在本文中，我们将以Scikit-learn的决策树和随机森林预测NBA获胜者。美国国家篮球协会（NBA）是北美主要的男子职业篮球联赛，被广泛认为是首屈一指的男子职业篮球联赛在世界上。它有30个团队（美国29个，加拿大1个）。

在常规赛期间，每支球队打82场比赛，每场41场。一支球队每年会有四次面对对手（16场比赛）。每个小组在其四次（24场比赛）中的其他两个小组中的六个小组中进行比赛，其余四个小组三次（12场）进行比赛。最后，每个队都会在另一场比赛中两次参加所有的球队（30场比赛）。

用决策树和随机森林预测NBA获胜者

＃导入数据集并解析日期导入熊猫作为pd df = pd 。read_csv （“NBA_2017_regularGames.csv” ，parse_dates = [ “Date” ]）

need-to-insert-img

从游戏玩法的描述中，我们可以计算机会率。在每场比赛中，主队和客队都有可能赢得一半时间

预测类

在下面的代码中，我们将指定我们的分类类。这将帮助我们查看决策树分类器的预测是否正确。如果主队获胜，我们将指定我们的等级为1，如果访客队在另一个名为“主队赢”的列中获胜，我们将指定为0。

< df [ “主队积分” ]\n\n","classes":{"has":1}}" data-cke-widget-upcasted="1" data-cke-widget-keep-attr="0" data-widget="codeSnippet" style="margin-top: 0px; margin-bottom: 0px; padding: 0px; white-space: pre-wrap; word-wrap: break-word;"> df [ “主队获胜” ] = df [ “访客积分” ] < df [ “主队积分” ]

need-to-insert-img

主队胜率：58.4％

＃该数组现在拥有scikit-learn可以读取的格式的类值。

特征工程

我们将创建以下功能来帮助我们预测NBA 2017年的获胜者。

无论是来访者还是主队都赢得了最后一场比赛。

一般认为哪个团队更好？

scikit-learn软件包实现CART（分类和回归树）算法作为其默认决策树类

决策树实现提供了一种方法来停止构建树，以防止过度使用以下选项：

分享：

网友评论

本文标题：python在Scikit-learn中用决策树和随机森林预测N

本文链接：https://www.haomeiwen.com/subject/bjzevhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python在Scikit-learn中用决策树和随机森林预测N

相关文章