去重复
df.drop_duplicates(['FLAG'])
loandata.drop_duplicates()
pd.merge(nn.to_frame(),mm.to_frame(),left_on='月份',right_on='FLAG')
默认索引合并
dd=pd.merge(b,a,left_on='FLAG',right_on='月份',left_index=True,right_index=True )
pandas DataFram 如何制定列的顺序(默认列名字典顺序)
问题:默认的是按照列名的字典顺序排序的,要固定顺序,按照自己想要的顺序。
解决方案:
加columns字段即可
例子:
columns = ['cmt','class_label','test_label','predict_label']
df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig",index=False,columns=columns)
df.replace series值替换
ser.replace(1, 11)
可以使用字典映射:将1替换为11,将2替换为12
ser.replace({1:11, 2:12})
df.fillna 使用0替代缺失值(当然你可以用任意一个数字代替NaN)
网友评论