最近在工作时,加载数据,原始数据用-1代表缺失值,之前加载的时候替换一直没有成功,后来直接把原文件的给改下,才去替换的。
今天 试了下如下方法,可行:
1. 加载数据时直接加载为str型;
2. 把-1替换为空;
3. 把转换后的字符型又给转成数值型即可。
=====================================================================================
方法2:
1. 打开文件直接把文件里面-1替换成null,并关闭
2. 加载csv文件,然后再replace替换np.nan
```
path_input = r'E:\ref_2020_11_9.csv'
pout_file = r'E:\ref_2020_11_9_001.csv'
print("before")
fout = open(pout_file,"w")
content = open(path_input).read().split("\n")[0:-1]
for line in content:
new_line = line.replace("-1","null")
fout.write("%s\n" % (new_line))
fout.close()
print("work finish")
aaa = pd.read_csv(pout_file)
uh_tc_feature = aaa.replace("null.0", np.nan)
```
网友评论