美文网首页python(常练思维不痴呆)
Python pandas模块21个常用操作可视化图解

Python pandas模块21个常用操作可视化图解

作者: statr | 来源:发表于2020-03-03 00:35 被阅读0次

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。

下面对pandas常用的功能进行一个可视化的介绍,希望能让大家更容易理解和学习pandas。

1、Series序列

系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。

image

2、从ndarray创建一个系列

如果数据是ndarray,则传递的索引必须具有相同的长度。如果没有传递索引值,那么默认的索引将是范围(n),其中n是数组长度,即[0,1,2,3…. range(len(array))-1] - 1]。

image

3、从字典创建一个系列

字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应的数据中的值将被拉出。

image

4、序列数据的访问

通过各种方式访问Series数据,系列中的数据可以使用类似于访问numpy中的ndarray中的数据来访问。

image

5、序列的聚合统计

Series有很多的聚会函数,可以方便的统计最大值、求和、平均值等

image

6、DataFrame(数据帧)

DataFrame是带有标签的二维数据结构,列的类型可能不同。你可以把它想象成一个电子表格或SQL表,或者 Series 对象的字典。它一般是最常用的pandas对象。

image image

7、从列表创建DataFrame

从列表中很方便的创建一个DataFrame,默认行列索引从0开始。

image

8、从字典创建DataFrame

从字典创建DataFrame,自动按照字典进行列索引,行索引从0开始。

image

9、列选择

在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下整理常用的列选择。

image

10、行选择

整理多种行选择的方法,总有一种适合你的。

image image image

11、返回指定行列

pandas的DataFrame非常方便的提取数据框内的数据。

image

12、条件查询

对各类数值型、文本型,单条件和多条件进行行选择

image image

13、聚合

可以按行、列进行聚合,也可以用pandas内置的describe对数据进行操作简单而又全面的数据聚合分析。

image image

14、聚合函数

data.function(axis=0) 按列计算

data.function(axis=1) 按行计算

image

15、分类汇总

可以按照指定的多列进行指定的多个运算进行汇总。

image

16、透视表

透视表是pandas的一个强大的操作,大量的参数完全能满足你个性化的需求。

image

17、处理缺失值

pandas对缺失值有多种处理办法,满足各类需求。

image

18、查找替换

pandas提供简单的查找替换功能,如果要复杂的查找替换,可以使用map(), apply()和applymap()

image

19、数据合并

两个DataFrame的合并,pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。

image

20、更改列名(columns index)

更改列名我认为pandas并不是很方便,但我也没有想到一个好的方案。

image

21、apply函数

这是pandas的一个强大的函数,可以针对每一个记录进行单值运算而不需要像其他语言一样循环处理。

image image

整理这个pandas可视化资料不易,如果你觉得本文对其他人有帮助,请分享给你的朋友,感谢感谢。

微信关注公众号:实战统计学,你的关注是我写作的动力,下次再整理更多的pandas可视化教程。

相关文章

  • python

    1)Python实现EXCEL常用操作——pandas简介 2)python-安装第三方包 3)python可视化...

  • Python pandas模块21个常用操作可视化图解

    Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型...

  • 说说Python中的pandas模块(1)

    Pandas是Python中最常用的数据分析模块,其强大的数据读写性能,丰富的可视化工具,便捷的数据切片及索引功能...

  • 2018-10-31

    Python 数据处理 1. 导入所需模块或库 导入数据处理pandas、numpy及可视化模块matplotli...

  • python数据挖掘

    python数据挖掘常用模块 numpy模块:用于矩阵运算、随机数的生成等pandas模块:用于数据的读取、清洗、...

  • Python OS模块常用方法总结

    Python OS模块常用方法总结Python OS模块方法:操作 说明os.g...

  • Python数据分析之pandas数据可视化

    Python数据可视化常用的是matplotlib库,matplotlib是底层库,今天学了pandas的数据可视...

  • python常用文件操作总结

    python 移动文件或文件夹操作。python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法...

  • Python Pandas使用

    用于数据探索和分析,基于numpy模块 安装 pip install pandas 常用操作 Series 序列(...

  • Python常用模块

    Python常用模块之time模块 Python常用模块之os模块 Python常用模块之sys模块 Python...

网友评论

    本文标题:Python pandas模块21个常用操作可视化图解

    本文链接:https://www.haomeiwen.com/subject/zxcokhtx.html