Task 2：EDA

Task 2：EDA

作者: 我是曾阿牛 | 来源:发表于2020-03-24 15:33 被阅读0次

Task 2：EDA
task2 数据的探索性分析（EDA）
Operation的addDependency操作
20180401雅思全程班基础写作1
前端学习十一
DataWhale二手车价格预测Task2-数据探索性分析EDA
How to cope with IELTS writing t
wednesday 28 december 2016
数据挖掘竞赛入门之二手车交易价格预测
任务开关

EDA目标

熟悉数据集
了解变量间的相互关系
为数据处理和特征工程做准备

内容介绍

载入数据科学库和可视化库

数据科学库：pandas、numpy、scipy
可视化库：matplotlib、seaborn

载入数据

载入训练集和测试集 pd.read_csv()
简略观察数据 df.head()+df.shape

数据总览

熟悉数据的相关统计量 df.describe()
熟悉数据类型 df.info()

判断数据确实和异常

查看每列存在nan的情况
异常值检测

了解预测值的分布

总体分布概况（无界约翰逊分布等）
查看skewness和kurtosis
查看预测值的具体频数

特征分类为类别特征和数字特征，并对类别特征查看unique分布

数字特征分析

相关性分析
查看几个特征的峰度和偏度
每个数字特征的分布可视化
数字特征相互之间的关系可视化
多变量互相回归关系可视化

类型特征分析

unique分布
类别特征箱型图可视化
类型特征的小提琴图可视化
类别特征的柱形图可视化
特征的每个类别频数可视化

用pandas_profiling生成数据报告

代码示例

见jupyter notebook，研究一下如何将notebook里的内容上传

相关文章

Task 2：EDA
EDA目标熟悉数据集了解变量间的相互关系为数据处理和特征工程做准备内容介绍载入数据科学库和可视化库数据...
task2 数据的探索性分析（EDA）
数据探索在机器学习中我们一般称为EDA（Exploratory Data Analysis）：是指对已有的数据（...
Operation的addDependency操作
我们有7个任务task1, task2, task3, task4, task5, task6, task7并发执...
20180401雅思全程班基础写作1
一.雅思写作简介：两篇文章 TASK 1 & TASK 2 TASK 1 20分钟 3分 TASK 2 40分钟...
前端学习十一
task11_1task11_2task11_3task11_4task11_5 你在学习中遇到什么问题？ tas...
DataWhale二手车价格预测Task2-数据探索性分析EDA
二手车数据探索性分析EDA Tip:此部分为零基础入门数据挖掘的 Task1 赛题理解部分，为大家入门数据挖掘比...
How to cope with IELTS writing t
IELTS Writing task 2 (or IELTS essay) is the same task fo...
wednesday 28 december 2016
Task1: deep learnng 5p(1.5h) Task2: doc2vec code Task3: s...
数据挖掘竞赛入门之二手车交易价格预测
Task2-EDATask3-特征工程Task4-模型调参Task5-模型融合
任务开关
任务切换 #define task1 0 #define task2 0 #define task3 1 #def...

网友评论

本文标题：Task 2：EDA

本文链接：https://www.haomeiwen.com/subject/euwoyhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Task 2：EDA|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！