Pandas是继numpy之后,一个非常高效的集数据存储,检索,运算于一身的python数据处理库。之前用过pandas因为numpy用惯了,所以有些不习惯使用pandas,使用了一阵子之后就放下了。最近在给公司写爬虫,又将pandas拿了起来。有了一些新的领悟和想法。
这里不做全面的pandas讲解,试问即便讲了,大家是否都能用得到呢?于是打算将平日里我用到的一些pandas的使用方法总结起来,介绍给大家,常用的方法希望大家都能用到。
将list或array写入DataFrame
- 准备一个numpy array和对应的list
- 读入到DataFrame
可以看到,直接将array传入到DataFrame, columns参数表示对矩阵中每一类的命名。调用describe()方法会对每列数据进行统计,一共统计8个数字:count, mean, std, min, 25%, 50%, 75%, max.
网友评论