美文网首页一些比赛收获
2018DC数据科学竞赛

2018DC数据科学竞赛

作者: 过气海豹 | 来源:发表于2018-11-27 17:27 被阅读0次

第一次组队参加比赛,第一次写博客。

这次DC住房月租金预测大数据赛收获还是挺多的,对我之后再组队参加类似的比赛将会有很大的帮助。

一场数据挖掘的比赛,要做的事情很多,首先是要拿到数据,如果数据很dirty(基本上比赛的数据都是这样的),先要进行数据预处理。数据预处理也分很多部分,比如数据清洗(缺失值和异常值处理)、数据变换等。这次比赛,比赛中我只简单处理了缺失值,尝试用0和均值填充缺失值,没有做数据变换等其他的处理方式,感觉很吃亏。建模过程中,我用了简单线性回归模型和多元线性回归模型,以及效果最好的随机森林模型。

暂时先写到这吧,贴一个大佬的开源:

https://github.com/notplaid/prices

相关文章

  • 2018DC数据科学竞赛

    第一次组队参加比赛,第一次写博客。 这次DC住房月租金预测大数据赛收获还是挺多的,对我之后再组队参加类似的比赛将会...

  • Kaggle vs.「经典的」数据科学

    Kaggle vs.「经典的」数据科学 首先,我们要清楚了解: Kaggle 竞赛和「经典的」数据科学有一些重要的...

  • 雷达图像预报未来降水? - CIKM AnalytiCup思路分

    《基于雷达图像的短期降水预报》是由ACM顶级数据挖掘会议CIKM举办的数据科学竞赛。CIKM 2017以“智慧城市...

  • [Kaggle] NDSB2: Diagnose Heart D

    这篇主要介绍Kaggle的第二届年度数据科学竞赛:Transforming How We Diagnose Hea...

  • [Kaggle] NDSB1: Predict Ocean He

    这篇主要介绍Kaggle的第一届年度数据科学竞赛:Predict ocean health, one plankt...

  • 科学抢答竞赛。

    今天我写完作业后,妈妈提议:爸爸,妈妈和我三人进行科学知识抢答竞赛。我特别高兴,比赛开始了。 爸爸先出题,我...

  • 下载kaggle数据集的小妙招

    kaggle是很多数据分析和机器学习初学者非常喜爱的数据科学竞赛平台。这个平台上有很多接近现实业务场景的数据集,非...

  • XGBoost的GPU加速插件

    XGBoost是诸如Kaggle等数据科学竞赛选手的利器。在特征属于许多不同范畴时,XGBoost的表现通常优于神...

  • 最实用的深度学习教程 Practical Deep Learni

    Jeremy Howard 在业界可谓大名鼎鼎。他是大数据竞赛平台 Kaggle 的前主席和首席科学家。他本人还是...

  • 数据竞赛

    主要的步骤: 1、 下载数据,详情见竞赛网址: 2、加载并读取数据,主要用pandas: 3 划分数据集: ...

网友评论

    本文标题:2018DC数据科学竞赛

    本文链接:https://www.haomeiwen.com/subject/hoxnqqtx.html