1. 把汇总表里的数据转换成百分比(最后一行)
def perc_convert(ser):
return ser/float(ser[-1])
2. 【DataFrame】把str的日期列转化为datetime
#方法一:parse()
f = lambda x:parse(x) if x!= 'null' else np.nan
data['first_visit_date'] = data['first_visit_date'].apply(f)
#方法二:pd.to_datetime()
pd.to_datetime(data['first_visit_date'] )
#另外,把yyyymmdd格式转换成yyyy-mm-dd:
def date_convert(ser):
if type(ser) ==float:
ser = str(ser)
return str(ser[0:4])+'-'+str(ser[4:6])+'-'+str(ser[6:8])
else:return ser
3 . np.random模块函数
参考原文:http://www.mamicode.com/info-detail-507676.html
np.random.randint(0,4,1000) :
生成由整数构成,最小为0,最大值为4 ,长度为1000的ndarray数组;
np.random.rand(10,5) :
生成10×5的随机数组,随机样本位于[0, 1)中;
numpy.random.randn(10,5):
生成10×5的随机数组,是从标准正态分布中返回一个或多个样本值;
uniform([low, high, size]):
生成一个均匀分布的数组,可指定最小值,最大值,数组大小;
网友评论