美文网首页我爱编程
Pandas 里的那些常用参数

Pandas 里的那些常用参数

作者: 减个肥怎么就那么难 | 来源:发表于2017-09-09 09:32 被阅读0次

    这里是一份持续更新的常用参数使用文档
    inplace, axis...

    import pandas as pd
    import tushare as ts
    

    inplace
    简单易懂的参数,表示初始的数据是否发生变化。当我们对数据进行再加工,可以先inplace=False来观察生成的效果,得到理想中的数据之后再inplace=True

    movies = ts.month_boxoffice()
    movies.head()
    
    image.png

    假设我们希望电影按照口碑来进行排序

    movies.sort_values('WomIndex', ascending=False).head()
    
    image.png
    movies.head()
    
    image.png

    可以看出movie是没有发生变化的,因为sort_values中的inplace默认参数是False,下面用inplace=True来改变movie数据本身。

    (shift + tab juypter 操作

    image.png
    movies.sort_values('WomIndex', ascending=False, inplace=True)
    movies.head()
    
    image.png

    axis
    axis轴线,其实表示的是你希望对数据操作的方向。axis=0,表示水平方向(rows)。axis=1,表示垂直方向(columns)。
    比如上例中axis=0,就表示我们按照每个row的womIndex来进行排序。这个时候使用axis=1,会直接报错。
    还是使用movies,来看一下axis=1的效果。

    movies.avgboxoffice = movies.avgboxoffice.astype(float)
    movies.avgshowcount = movies.avgshowcount.astype(float)
    

    loc操作

    movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=0)
    
    avgboxoffice    364.0
    avgshowcount    219.0
    dtype: float64
    
    movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=1)
    
    6     48.0
    0     75.0
    7     50.0
    8     46.0
    2     52.0
    3     54.0
    4     53.0
    1     59.0
    5     52.0
    9     49.0
    10    45.0
    dtype: float64
    

    当axis=0的时候,计算列avgboxoffice,avgshowcount每行的加总
    当axis=1的时候,计算每行avgboxoffice,avgshowcount列的加总

    相关文章

      网友评论

        本文标题:Pandas 里的那些常用参数

        本文链接:https://www.haomeiwen.com/subject/wxsojxtx.html