好久不见,今天给大家带来新的内容——pandas,这个库有多出名就不用我说了吧,下面正式今天的学习。
创建Series
很容易看出,行索引(我喜欢这么叫)的数值默认是从0开始的数字,如果想要改变行索引,可以设置index的值,注意index是一个列表。
如果含有一个float类型的数字或一个无效值(np.nan),那么即使其它都是整型,其类型也是浮点型。
如果内容只有一个,其会随着索引而重复出现。
字典创建Series的方式
创建DataFrame
什么是DataFrame?可以简单地认为DataFrame就是一个表格。
和Series一样,DataFrame的行索引也是默认为从0开始的数字,如果想要改变,也可以通过设置index来改变。
但是由于Series的行索引的默认值是从0开始的,所以'C'列无法显示,故而需要给'C'列添加同样的行索引。
另一种创建DataFrame的方法是分别使用列表的形式创建行索引和列索引。
查看DataFrame的数据
查看前五行。
当然,查看前五行只是默认值,我们还可以查看前三行等等。
查看后五行。
查看行索引和列索引。
查看内容
查看每一列对应的数据类型
对每一列的数据进行总结描述
分别是元素的个数、平均值、标准差、最小值、前25%大、……、最大值
当然,如果数据类型是字符,就没有所谓的最大值最小值之类的了,取而代之的是count(字符个数)、unique(不同字符的个数)、top(最多的字符)、freq(最多字符的个数)
DataFrame的变化
为了演示方便,我先创建一个乱序的DataFrame
转置
行索引排序(默认)
列索引排序
列索引排序,并把升序改为降序
把列索引为2的内容进行排序
把行索引为2的内容进行排序
把行索引为2的内容进行降序排序
网友评论