【导语】在做数据分析时都会用到 Pandas。虽然 Pandas 的功能十分强大。但是实际用的时候,并不能快速的找到对应的解决方案,那么其实Pandas官方早就提供了一份知识框架,放在了Github上。
地址:https://github.com/pandas-dev/pandas/tree/master/doc/cheatsheet
这两张图片一共归纳了13类常用的Pandas操作,下面我们就来简单看一看。
1、数据创建
介绍了几种常用的DataFrame创建语法
2、数据重塑
这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示,理解起来简直不要太方便!
3、数据筛选
这一块区域主要是分别用行/列来讲解一些常用的数据查看、抽样、切片等操作,包含了tail
、head
、loc
、iloc
等非常重要的方法,并且同样给出了部分动画便于理解
4、数据探索
这一块主要给出了一些在进行探索性分析时常用的方法,比如max
、min
、count
等,不过官方将apply放在这里,并没有展开讲解
5、数据修改
这两个区域为缺失值处理和创建新的列,重点用动画示例了assign
和qcut
方法,缺失值处理部分仅给出了两个方法,应该是偷懒了
6、数据分组
主要就是groupby
和相关方法
7、数据连接
这里介绍的还是非常详细!用图片例子来展示pd.merge
中的各种参数变化的不同,一看就懂
8、绘制图表
绘制可视化图表是Pandas的一个重要功能。不过受限于篇幅,官方在这里仅仅是一笔带过。
大家应该能看出来,这是一份提纲挈领的“学习线索”,为你理清思路,指明方向。但是仅仅靠着两张图片是不可能把所有内容就弄明白的,它更像是我们考试前划的“复习重点”。通过这两张表,我们可以了解哪些操作可以用Pandas完成,以及在你不确定用什么方法处理数据时,快速查到Pandas中的哪个函数可以做到。因为微信会对图片进行压缩,所以可以直接访问项目地址。
希望本文的内容对大家的学习或者工作能带来一定的帮助,每天进步一点点,加油♥。
网友评论