pandas

作者: Tu_jc | 来源:发表于2019-03-18 23:18 被阅读0次

一、Series

obj = pd.Series(index, values)

                        =    索引  +  一维数组

  index对象不可修改

obj.reindex(index,methond,fill_value):创建一个适应新索引的新对象。index:新索引;methon:ffill/bfill前/后填充;fill_value:填充值

obj.isnull()、obj.notnull: 检测缺失值

obj.dripna():去除缺失值

obj.fillna():填充缺失值

obj.map()

obj.replace(a,b):a替换为b

obj.value_counts():返回值出现的频率


二、DataFrame

df = pd.DataFrame(data,columns,index)

=多列数组+列索引+行索引

pandas

df.ix[val1,val2]:同时选择行和列。

df.apply(f):执行自定义函数f

df.map(str.lower):转为小写

df.replace():

df.head()/.tail():前/后5行

df.fillna()

pd.merge(df1,df2,how,on):左右按索引合并df1,df2,左右拼接

pd.concat(s1,s2,s3):上下拼接s1,s2,s3

pd.get_dummies(df['key']):独热/哑变量

三、TimeSeries

pd.date_range(start,end,periods,freq,normalize,) normalize=True:时间规范化,转为整点

pd.date_range("20190319","20190419")

默认按天为间隔

pd.date_range(start="20190319",periods=31)

pd.date_range(end="20190419",periods=31)

ts.shift(n):沿着时间轴向(+)后或前(-)移数据

ts.resample(feq='M',how='mean'):重采样

pd.rolling_mean(ts,10):十个数的平均值移动窗口

相关文章

网友评论

      本文标题:pandas

      本文链接:https://www.haomeiwen.com/subject/kboimqtx.html