数据应用上节读取的CSV;
1.值分类汇总
counts = df['hGrade'].value_counts()
print counts
2.绘制柱形图,并保存
plt = counts.plot(kind='bar').get_figure()
plt
plt.savefig('/Users/baidu/Downloads/plot.png')
3.数据分组
#数据准备
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C':np.random.randn(8),
'D':np.random.randn(8)})
print df
#根据列A进行分组,取每组第一行数据
grouped = df.groupby('A')
print grouped.first()
#根据多列进行分组A,B列
grouped = df.groupby(['A', 'B'])
print grouped.last()
根据列进行分组
def get_type(letter):
if letter.lower() in 'abem':
return 'vowel'
else:
return 'consonant'
grouped = df.groupby(get_type, axis=1)
print grouped.first()
网友评论