数据探索神器：Pandas_profiling

数据探索神器：Pandas_profiling

作者: 四毛m | 来源:发表于2020-03-03 20:17 被阅读0次

数据探索神器：Pandas_profiling
用pandas_profiling快速探索数据，算不算EDA（E
我偷懒，我有理（办公神器大推荐！）
python-pandas_profiling安装包时出现的问题
数据处理神器tidyverse（2）ggplot2
android看片神器(1)——【新点亮视频】
Android Studio代码块生成插件－TemplateCr
# 花5分钟给你的Paper加几张Figure， TCGA蛋白数
数据处理基石：Pandas数据探索
探索神器大自然

写在前面的话

开始做数据分析，最头疼的就是数据探索和清洗了。Pandas里面有很多函数用于初步探索和分析，例如pd.describe()。

今天逛着逛着，发现了一个数据库，能够用一行代码就实现原始数据集的概览分析并生成html文件，这对我们对数据分布的大致情况很有帮助滴。

不过我在安装过程吃了很大的苦头，折腾了整整一个下午才搞定，所以想和大家也分享一下，避免和我一样踩坑！

1.先看一下它强大的report功能

image.png

从截图可以知道，report由5部分组成，分别是

1.Overview（数据概况）：包括列数、行数、缺失率、重复率、变量类型、内存以及对数据的最终结论warning。

image.png
2.Variables（变量情况）：对每个变量进行描述性统计分析，包括缺失值、最小值、Q1、中位数、Q3、最大值、标准差、变异系数等，此外还有直观的直方图可以查看。

image.png
3.Interactions（交互性分析）：对每两个变量进行图表展示。

image.png
4.Correlations（相关性分析）：制作变量间的热力图，进行相关性展示，Spearman、Pearson等各类矩阵都可以查看。

image.png

5.Missing Values（缺失值情况）：对全部变量进行缺失值图表展示。

image.png

6.Sample（数据示例）：对数据的前10行和后10行进行展示。

image.png

这个信息量很足的报告只需要一行代码就可以完成：

image.png

是不是帮我们省了好多力气呀~

2.安装Pandas_profiling

安装很简单，因为我自己用的是Anaconda，所以本来想要conda安装的，不过conda里面没有，所以最终使用pip安装的：
打开cmd》pip install pandas_profiling
安装完如果你的Jupyter Notebook无法打开，并且显示：[AttributeError: module 'attr' has no attribute 's']，则：
打开cmd》pip uninstall attr》pip install attrs
（想想我刚开始打不开Jupyter那痛苦的心情就觉得心塞）

3.使用Pandas_profiling

1.生成报告：data=pd.read_csv('train.csv')》data.profile_report(title='Data')
2.保存报告：data.profile_report(title='Data').to_file('Data.html')

相关文章

数据探索神器：Pandas_profiling
写在前面的话开始做数据分析，最头疼的就是数据探索和清洗了。Pandas里面有很多函数用于初步探索和分析，例如pd...
用pandas_profiling快速探索数据，算不算EDA（E
拿到数据进行分析之前，应该对数据进行探索，所谓的探索性数据分析(EDA: Exploratory Data Ana...
我偷懒，我有理（办公神器大推荐！）
目录：神器一：数据收集神器——金数据！神器二：文档排版神器——排版助手神器三：文件搜索神器——Everyth...
python-pandas_profiling安装包时出现的问题
1。今天pip install pandas_profiling时出现了 2。 pandas包不匹配的问题，所以...
数据处理神器tidyverse（2）ggplot2
数据处理神器tidyverse（1）dplyr 数据处理神器tidyverse（2）ggplot2 这样输出的是空...
android看片神器(1)——【新点亮视频】
继之前那一篇看片神器——【米侠浏览器】，这是我探索到的第二个很喜欢的看片神器。我觉得吧，还是因为穷，激发了探索的...
Android Studio代码块生成插件－TemplateCr
TemplateCreator 自从发现LayoutCreator这个高效开发神器后，感觉应该探索下Android...
# 花5分钟给你的Paper加几张Figure， TCGA蛋白数
TCGA蛋白数据挖掘神器来了作者：白介素2 TCGA的神器这么多，据白介素同学所知，能够做 TCGA蛋白数据挖掘...
数据处理基石：Pandas数据探索
Pandas数据初探索本文介绍的是Pandas数据初探索。当我们生成或者导入了数据之后，通过数据的探索工作能够快...
探索神器大自然
学校为上一学期的三好学生组织了一次研学旅行，走进无锡野生动物园，探索神器的大自然，与大自然链接，畅游在欢乐的气氛中...

网友评论

本文标题：数据探索神器：Pandas_profiling

本文链接：https://www.haomeiwen.com/subject/qmlklhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据平台组件技术

热点阅读

大数据平台组件技术

Python

Python

Python

Python 生信

关于我们|服务条款|联系我们|数据探索神器：Pandas_profiling|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！