美文网首页我爱编程
Pandas库介绍--统计相关

Pandas库介绍--统计相关

作者: viean | 来源:发表于2018-05-22 22:21 被阅读0次

数据应用上节读取的CSV;
1.值分类汇总

counts = df['hGrade'].value_counts()
print counts

2.绘制柱形图,并保存

plt = counts.plot(kind='bar').get_figure()
plt
plt.savefig('/Users/baidu/Downloads/plot.png')

3.数据分组

#数据准备
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                  'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                  'C':np.random.randn(8),
                  'D':np.random.randn(8)})
print df
#根据列A进行分组,取每组第一行数据
grouped = df.groupby('A')
print grouped.first()
#根据多列进行分组A,B列
grouped = df.groupby(['A', 'B'])
print grouped.last()

根据列进行分组

def get_type(letter):
    if letter.lower() in 'abem':
        return 'vowel'
    else:
        return 'consonant'
    
grouped = df.groupby(get_type, axis=1)
print grouped.first()

相关文章

网友评论

    本文标题:Pandas库介绍--统计相关

    本文链接:https://www.haomeiwen.com/subject/zoehrftx.html