数据分析学习记录W28——如何快速核算各字段的空值率

数据分析学习记录W28——如何快速核算各字段的空值率

作者: 演奏的船长 | 来源:发表于2020-04-21 18:25 被阅读0次

数据分析学习记录W28——如何快速核算各字段的空值率
hive 常用语句
表约束
全网100篇超全超酷数据分析入门资料
java错题集
数据透视表分析实践
MYSQL-空值与非空
第三讲：如何记录自己的代码并转换成网页格式
SQL基础-DML语句
Excel读书笔记18（2）——数据透视表

在数据分析过程中，常见的一个问题是数据表的字段繁多，条目数巨大。若不加筛选检视，不仅会给分析造成干扰——要花更多的时间才能翻出来自己需要的字段，更可能在开展分析后才发现关键的字段值有缺失，导致分析思路要调整，甚至分析结论有误。所以，在拿到数据的那一刻就能快速判断数据的基本质量，那些字段可用不可用，也即空值的比例，就显得尤为重要。
这段时间就在思考这个问题，目前找到了三种解决思路，在此进行一个梳理。

1. 使用Excel公式

这是我之前使用的方式，优点是上手容易门槛低，excel每个电脑都有装，公式也是现成的，马上就能应用；缺点是操作比较麻烦，如果数据源不是excel文件，就需要先从数据库导出或转换。如果遇到数据量很大的情况，就玩不转了。

2. 使用Python库里现成的指令

这个是听同事讲的，在Python的库中就有一个dataframe.info()的指令，以及更高级的 Pandas Profiling 包，可以快速列出数据表的基本信息。优点显而易见，指令简单，快速出结果。缺点也显而易见，就是得先入门Python。

image.png

3. 使用Tableau Prep

Prep本身就是处理数据的，所以自动会在每个下面显示出字段的名称类型空值等信息。这是它的优点，你可以一个字段一个字段的进行观察。缺点则是不够一目了然，而且还是要单独再打开一个程序，配置连接等等。

以上就是目前我找到三种核算空值率的思路，整体来说是“核算”有余，“快速”不足。还需要更进一步的思考和实践。

相关文章

数据分析学习记录W28——如何快速核算各字段的空值率
在数据分析过程中，常见的一个问题是数据表的字段繁多，条目数巨大。若不加筛选检视，不仅会给分析造成干扰——要花更多的...
hive 常用语句
统计字段空值率
表约束
非空约束 1，数据库字段的某个值是否可以为空，null字段值可以为空，NOT NUL...
全网100篇超全超酷数据分析入门资料
《数据分析需要学习哪些技术，如何快速学习数据分析》 ?7616 ?223 @大数据在说话《数据分析培训...
java错题集
1、数据库字段默认值不能为null，要有默认值空值，插入数据最好对有默认值的字段也塞值（默认值），更新数据时对可能...
数据透视表分析实践
一、数据透视表简介数据透视表就是对Excel数据中的各字段进行快速分类汇总的一种分析工具，它是一种交互式报表。利...
MYSQL-空值与非空
NULL 字段值可以为空 NOT NULL 字段值禁止为空
第三讲：如何记录自己的代码并转换成网页格式
3.1 记录自己的代码和分析步骤在生信学习中，我们经常会写一些代码来帮助快速实现数据分析。如何有效且便捷的记录自...
SQL基础-DML语句
查看数据表的信息： 1.插入记录 insert into 表名（字段1，字段2）values （值1，值2）; ...
Excel读书笔记18（2）——数据透视表
五、数据透视表的组合功能：快速编制月报、季报、年报我们使用数据透视表进行统计分析时，它默认以字段下的每个唯一值作...

网友评论

本文标题：数据分析学习记录W28——如何快速核算各字段的空值率

本文链接：https://www.haomeiwen.com/subject/ildpihtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|数据分析学习记录W28——如何快速核算各字段的空值率|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！