Kaggle

Kaggle

作者: 雨宝_f737 | 来源:发表于2019-01-03 20:58 被阅读0次

kaggle API配置
竞赛相关
Kaggle: Detect toxicity - Basic
【案例-数据分析】Wine Reviews
练习赛1：Titanic
【案例-数据挖掘】银行营销
Kaggle案例-基于SQL的Black Friday数据分析
用TensorFlow完成Kaggle Titanic竞赛
Kaggle入门
5天10分钟，学会数据清洗！（Python）

数据预处理：

步骤：

删除不需要的列；填补缺失值；类别特征进行labelencode；连续值进行切分

1.分析数据有哪些是类别型的/哪些是数值型的/哪些是混合数据类型/哪些数据是可能有错误/哪些特征包含空格空值/特征是什么类型的：

类别型中有没有是有序数关系的；数值型数据中是否是连续的或者离散的；混合数据类型中是数值字母和数字混合；如名字里面含有括号等；特征是整型浮点型还是字符串型。

train_df.info()也太好用了吧！告诉你每个特征类型和有多少个值这样就知道缺失的值个数。

train_df.describe()知道数据的信息。

2.分析特征和目标的关系，特征取某个值的时候目标值为1的概率大，针对类别/序数/离散型数据比较有效。

3.连续型数值的话处理使用直方图。使用seaborn中的FacetGrid http://www.pianshen.com/article/5733143837/

4.处理数据

有些数据删除：train_df.drop()默认是不会改变原数据的，对原数据进行重新赋值。别忘了加入combine.

有些string类别数据需要转换为数字：使用dataset[].map(字典)

有些数据有缺失：dataset[].fillna()，删除na的话使用dropna()，同时可以使用某一类数据的特征值填充，找到空的值isnull()

有些连续型数据：分段然后赋值

相关文章

kaggle API配置
需要两点进行kaggle API配置： github上下载kaggle API kaggle 账户上产生token...
竞赛相关
Kaggle 新手入门之路 (完结)Kaggle官网kaggle word-vectors 转载一篇别人 kagg...
Kaggle: Detect toxicity - Basic
This kaggle is： https://www.kaggle.com/c/jigsaw-unintende...
【案例-数据分析】Wine Reviews
from kaggle：https://www.kaggle.com/zynicide/wine-reviews ...
练习赛1：Titanic
kaggle Titanic项目主页：https://www.kaggle.com/c/titanicTitani...
【案例-数据挖掘】银行营销
数据来源kaggle(uci数据集)： https://www.kaggle.com/janiobachmann/...
Kaggle案例-基于SQL的Black Friday数据分析
数据来源：kaggle https://www.kaggle.com/sdolezel/black-friday/...
用TensorFlow完成Kaggle Titanic竞赛
Kaggle Titanic竞赛[https://www.kaggle.com/c/titanic/overvie...
Kaggle入门
如何下载Kaggle上的数据集？首先要下载Kaggle上对应的API工具，需要先安装Kaggle。在vsc中输...
5天10分钟，学会数据清洗！（Python）
这是来自Kaggle的Data Cleaning Challenge For 5 Days! Kaggle是国外著...

网友评论

本文标题：Kaggle

本文链接：https://www.haomeiwen.com/subject/qnqfrqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Kaggle|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！