美文网首页数据分析类kaggle数据分析
Kaggle数据挖掘竞赛入门系列:(一)Kaggle简介

Kaggle数据挖掘竞赛入门系列:(一)Kaggle简介

作者: 王十二的 | 来源:发表于2017-09-17 19:34 被阅读579次

    Kaggle是全球最大的数据分析在线平台,吸引了全球范围内数十万的顶级数据科学家,同时也是检测我们机器学习技能的最佳平台。

    一、Kaggle简介

    Kaggle成立于2010年,网址:https://www.kaggle.com/

    这里写图片描述
    Kaggle是全球范围内最大的数据众包平台。
    企业或者研究者与Kaggle合作之后,可以将数据、问题描述、期望的指标发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案,类似于KDD-CUP(国际知识发现和数据挖掘竞赛)。
    Kaggle上的参赛者将数据下载下来,分析数据,然后运用机器学习、数据挖掘等知识,建立算法模型,解决问题得出结果,最后将结果提交,如果提交的结果符合指标要求并且在参赛者中排名第一,将获得比赛丰厚的奖金。

    二、参加Kaggle比赛的基本流程

    1.选择一个比赛项目

    这里写图片描述

    2.加入竞赛,理解项目需求“Competition Details”

    这里写图片描述

    3.下载数据,训练模型,得出结果“Get the Data”

    这里写图片描述

    4.提交结果“Make a submission”

    这里写图片描述

    三、解题思路

    模仿是最好的学习方式!

    这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。
    1.Titanic(泰坦尼克之灾)
    中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
    英文教程:An Interactive Data Science Tutorial

    2.House Prices: Advanced Regression Techniques(房价预测)
    中文教程:Kaggle竞赛 — 2017年房价预测
    英文教程:How to get to TOP 25% with Simple Model using sklearn

    3.Digital Recognition(数字识别)
    中文教程:大数据竞赛平台—Kaggle 入门
    英文教程:Interactive Intro to Dimensionality Reduction

    欢迎关注微信公众号:kaggle数据分析

    相关文章

      网友评论

        本文标题:Kaggle数据挖掘竞赛入门系列:(一)Kaggle简介

        本文链接:https://www.haomeiwen.com/subject/vkemsxtx.html