这篇我们继续来介绍pandas的数据结构,上篇里提到的Series为一维数组,而此篇的主角DataFrame则为二维数组,它也同样可以存放多种类型的数据。
创建DataFrame
pandas提供了两种创建DataFrame的途径
-
pandas.DataFrame()函数
可以由Python字典或NumPy的ndarray创建DataFrame
DataFrame函数 -
pandas.concat() 函数
可以将一组Series组合为一个DataFrame,也支持多个DataFrame组合。
Concat函数
DataFrame有两个重要属性
- index 属性
索引值,与Series的index属性类似 -
columns属性
列名,纵向Series的名称,为DataFrame提供了第二个维度
index与columns属性
获取DataFrame中元素
获取元素方式与Series基本一致,但有一点你必须时刻牢记于心,DataFrame是二维的。
获取DataFrame元素
过滤DataFrame中元素
使用loc函数加上普通比较符就可以方便的对DataFrame中的元素进行过滤
过滤元素
列操作
DataFrame支持列的新增与删除
列操作
DataFrame组合
可以使用concat()函数,组合两个DataFrame
组合DataFrame
绘图
使用matplotlib可进行方便的绘图
绘图
统计方法
DataFrame已经内置了统计学方法,可以方便地获取统计数据,但与Series不同,需要指定统计的维度,通过行还是列进行统计。
Paste_Image.png标量运算
DataFrame支持标量,我们可以对其中所有元素进行等比例放大或同时加减某值。
支持标量运算
到这里,pandas中Series和DataFrame这两个数据结构就已经介绍完了,只是介绍了常见的一些用法,更高级的应用大家可以自行去查官网的文档。
谢谢阅读,欢迎订阅!
网友评论