美文网首页我爱编程
Pandas库介绍--统计相关

Pandas库介绍--统计相关

作者: viean | 来源:发表于2018-05-22 22:21 被阅读0次

    数据应用上节读取的CSV;
    1.值分类汇总

    counts = df['hGrade'].value_counts()
    print counts
    

    2.绘制柱形图,并保存

    plt = counts.plot(kind='bar').get_figure()
    plt
    plt.savefig('/Users/baidu/Downloads/plot.png')
    

    3.数据分组

    #数据准备
    import pandas as pd
    import numpy as np
    df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                      'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                      'C':np.random.randn(8),
                      'D':np.random.randn(8)})
    print df
    
    #根据列A进行分组,取每组第一行数据
    grouped = df.groupby('A')
    print grouped.first()
    
    #根据多列进行分组A,B列
    grouped = df.groupby(['A', 'B'])
    print grouped.last()
    

    根据列进行分组

    def get_type(letter):
        if letter.lower() in 'abem':
            return 'vowel'
        else:
            return 'consonant'
        
    grouped = df.groupby(get_type, axis=1)
    print grouped.first()
    

    相关文章

      网友评论

        本文标题:Pandas库介绍--统计相关

        本文链接:https://www.haomeiwen.com/subject/zoehrftx.html