工欲善其事必先利其器,在使用Python做数据挖掘和数据分析时,一大必不可少的利器就是Pandas库了。pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
下面就从创建数据、查看数据、筛选数据、统计数据、缺失值处理、数据可视化等14个方面介绍Pandas数据处理的基本操作,希望对广大数据爱好者有所帮助。
1、创建数据
![](https://img.haomeiwen.com/i3719570/7ec1c3f30c31310a.jpg)
2、查看数据
![](https://img.haomeiwen.com/i3719570/7c9f7a60c6e56fbd.jpg)
3、选择数据
![](https://img.haomeiwen.com/i3719570/80fe7076d6514dcc.jpg)
4、读取CSV文件数据
![](https://img.haomeiwen.com/i3719570/4761c079490ef1e3.jpg)
5、筛选数据
![](https://img.haomeiwen.com/i3719570/0887e29d967b141a.jpg)
6、增加和删除数据
![](https://img.haomeiwen.com/i3719570/4d29744ff0b21c30.jpg)
7、计数统计
![](https://img.haomeiwen.com/i3719570/e77de31d41f200c0.jpg)
8、数据分组
![](https://img.haomeiwen.com/i3719570/2f7dd488774024c3.jpg)
9、缺失值处理
![](https://img.haomeiwen.com/i3719570/c3b414473088018e.jpg)
10、排序与合并
![](https://img.haomeiwen.com/i3719570/344834ef68dd409d.jpg)
11、可视化
![](https://img.haomeiwen.com/i3719570/43a0917a1baef4b5.jpg)
12、字符串操作
![](https://img.haomeiwen.com/i3719570/07f586593431189f.jpg)
13、广播
![](https://img.haomeiwen.com/i3719570/4115a4601661d091.jpg)
14、数据库操作
![](https://img.haomeiwen.com/i3719570/374686762d37a3ea.jpg)
以上就是Pandas进行数据处理的14个基本方面的内容,更高清的文本内容可关注我的知乎“pro-am”进行查看;更多数据挖掘和机器学习方面的学习资源,欢迎关注我的微信公众号“DT新纪元”,期待与你一起成长。
![](https://img.haomeiwen.com/i3719570/8c1993c83ca4cc53.jpg)
注:以上内容虽不完全自己原创,但也是自己辛苦学习和整理所得,知识可以分享,但请不要恶意抄袭,转载前请先征求我的同意,希望大家多多理解,在此谢过!
网友评论