美文网首页数据分析数据分析
简单线性回归——公共自行车使用量预测

简单线性回归——公共自行车使用量预测

作者: 大刘家的阿俊 | 来源:发表于2018-07-25 10:33 被阅读8次

#一

使用的数据集是SofaSofa上练习赛的自行车数据,通过简单的分析,构建线性回归模型,RMSE评价好于标杆模型中的线性回归模型和决策树回归模型。

#二

第一步,看看训练数据长啥样子,加载数据,查看下前3个观测

看下数据的说明

看下观测数量以及有没有缺失值

可以看到,共有10000个观测,没有缺失值。

接下来可以看看每个变量的基础描述信息

通过观察可以得出一些猜测,如城市0和城市1基本可以排除南方城市;整个观测记录时间跨度较长,可能还包含了一个长假期数据等。

最后看看相关系数(为了方便查看,绝对值低于0.2的就用nan替代)

从相关性角度去看,用车的时间和当时的气温对对借取数量y有较强关系;气温和体感气温显强正相关(共线性),这个和常识一致

#三

现在开始看看图。

先看下城市和时间变量,对借取量y有没有影响

城市0的借取量高于城市1,借取量的高峰在早上8点和晚上5/6点,和日常上下班高峰时间基本吻合,估计都是命苦的上班族

节假日是否会影响借取量?

可以看出,只对城市0有影响,但影响有限

温度对借取量呈现线性相关

天气对借取量影响明显,而且城市0的人好猛,强降雨天气依然借取出行

风速对借取量也有影响,无风或大风天借取量较少

#四

依据上面的情况,选择城市、时间、当时的气温、天气状况、风速等5个变量作为特征变量拟合模型

模型训练完成,剩下的就是使用测试集进行预测,上传预测结果

RMSE( 均方根误差 )

比标杆的线性回归和决策树回归要好。

相关文章

  • 简单线性回归——公共自行车使用量预测

    #一 使用的数据集是SofaSofa上练习赛的自行车数据,通过简单的分析,构建线性回归模型,RMSE评价好于标杆模...

  • 公共自行车使用量预测

    公共自行车低碳、环保、健康,并且解决了交通中“最后一公里”的痛点,在全国各个城市越来越受欢迎。希望通过分析时间、天...

  • ML坚持之路_Day2

    Day_2 简单线性回归 概述 使用一个简单的特征来预测将来值 线性回归是一种基于非独立变量X来预测独立变量Y的...

  • 多元线性回归2021.3.18

    1.多元线性回归(变量之间相互独立) 当预测变量不止一个时,简单线性回归就变成了多元线性回归,相当于求解多元方程。...

  • 总结|公共自行车使用量预测

    本篇文章主要对在本次竞赛中排名靠前的同学的优化方法进行总结。东文,14.835 第47名冰琪,14.852 第...

  • 回归专题-1 | 线线性回归基础

    回归专题-1 | 线线性回归基础 导读 ① 线性回归(又称线性模型),通过一个或者多个预测变量(X)来预测定量结局...

  • 机器学习实战Py3.x填坑记8—预测数值型数据:回归

    本章内容:线性回归局部加权线性回归岭回归和逐步线性回归预测鲍鱼年龄和玩具售价 回归与分类一样,都是预测目标值的过程...

  • Task1 - 3

    Task 1 线性回归 模型 线性回归用于回归预测,即预测一个连续的数值。一个n元线性回归模型 其中 是要模型学习...

  • 回归分析 | R语言 -- 简单线性回归

    R中的简单线性回归 简单线性回归被用于预测一个量化结果y基于一个单一预测变量的x。目标是建立将y定义为x变量的函数...

  • 神经网络基础1:实现一个简单的神经网络

    线性回归网络 在神经网络基础0:线性逻辑回归理论实现章节,我们通过对y = wx+b的预测,实现了一个最简单的线性...

网友评论

    本文标题:简单线性回归——公共自行车使用量预测

    本文链接:https://www.haomeiwen.com/subject/rubumftx.html