一、Series
obj = pd.Series(index, values)
= 索引 + 一维数组
index对象不可修改
obj.reindex(index,methond,fill_value):创建一个适应新索引的新对象。index:新索引;methon:ffill/bfill前/后填充;fill_value:填充值
obj.isnull()、obj.notnull: 检测缺失值
obj.dripna():去除缺失值
obj.fillna():填充缺失值
obj.map()
obj.replace(a,b):a替换为b
obj.value_counts():返回值出现的频率
二、DataFrame
df = pd.DataFrame(data,columns,index)
=多列数组+列索引+行索引

df.ix[val1,val2]:同时选择行和列。
df.apply(f):执行自定义函数f
df.map(str.lower):转为小写
df.replace():
df.head()/.tail():前/后5行
df.fillna()
pd.merge(df1,df2,how,on):左右按索引合并df1,df2,左右拼接
pd.concat(s1,s2,s3):上下拼接s1,s2,s3
pd.get_dummies(df['key']):独热/哑变量
三、TimeSeries
pd.date_range(start,end,periods,freq,normalize,) normalize=True:时间规范化,转为整点
pd.date_range("20190319","20190419")
默认按天为间隔
pd.date_range(start="20190319",periods=31)
pd.date_range(end="20190419",periods=31)
ts.shift(n):沿着时间轴向(+)后或前(-)移数据
ts.resample(feq='M',how='mean'):重采样
pd.rolling_mean(ts,10):十个数的平均值移动窗口
网友评论