pandas

作者: Tu_jc | 来源:发表于2019-03-18 23:18 被阅读0次

    一、Series

    obj = pd.Series(index, values)

                            =    索引  +  一维数组

      index对象不可修改

    obj.reindex(index,methond,fill_value):创建一个适应新索引的新对象。index:新索引;methon:ffill/bfill前/后填充;fill_value:填充值

    obj.isnull()、obj.notnull: 检测缺失值

    obj.dripna():去除缺失值

    obj.fillna():填充缺失值

    obj.map()

    obj.replace(a,b):a替换为b

    obj.value_counts():返回值出现的频率


    二、DataFrame

    df = pd.DataFrame(data,columns,index)

    =多列数组+列索引+行索引

    pandas

    df.ix[val1,val2]:同时选择行和列。

    df.apply(f):执行自定义函数f

    df.map(str.lower):转为小写

    df.replace():

    df.head()/.tail():前/后5行

    df.fillna()

    pd.merge(df1,df2,how,on):左右按索引合并df1,df2,左右拼接

    pd.concat(s1,s2,s3):上下拼接s1,s2,s3

    pd.get_dummies(df['key']):独热/哑变量

    三、TimeSeries

    pd.date_range(start,end,periods,freq,normalize,) normalize=True:时间规范化,转为整点

    pd.date_range("20190319","20190419")

    默认按天为间隔

    pd.date_range(start="20190319",periods=31)

    pd.date_range(end="20190419",periods=31)

    ts.shift(n):沿着时间轴向(+)后或前(-)移数据

    ts.resample(feq='M',how='mean'):重采样

    pd.rolling_mean(ts,10):十个数的平均值移动窗口

    相关文章

      网友评论

          本文标题:pandas

          本文链接:https://www.haomeiwen.com/subject/kboimqtx.html