1. 处理缺失值
1.1 用众数或者平均值填充
函数:pandas.DataFrame.fillna
2. 将字符串转换为数值
代码:
#这里把性别数据值字符串不便于计算换成数值,
#用1代表男性,用0代表女性,将性别数值化
def sex_value(Sex):
if Sex=='male':
return 1
else:
return 0
df['Sex']=df['Sex'].apply(lambda x:sex_value(x))
网友评论