有个视频讲的不错:如何征服Kaggle数据竞赛?
为什么要玩kaggle?
- 可以接触不同类型的数据(文本、图像、视频、信号)
- 可以提供大规模的计算资源
- 可以在简历中表达自己对数据科学的热爱,这有助于找工作
- kaggle上有一些不错的数据科学的职位发布
kaggle社区的优点
- 讨论区(Discussion)有很多有价值的东西(很棒的算法、特征、解决方案、新工具等)类似问答
- 笔记本(Notebook)用户处理数据的过程草稿记录 类似jupyter笔记或专栏
- kaggle 用户等级系统
- Grandmasters
- masters
- experts
- contributors
- novices
- 可以通过组队来参加比赛并且提升自己的名次
kaggle比赛设置
kaggle提供:
- 训练集(含标签)
- 测试集
提交结果后,你可以立即看到public测试集上的结果,但比赛结束后才可以看到private测试集上的结果。在public上的结果不一定与private上的结果一致,因为有可能overfitting而导致泛化能力不足。
网友评论