生成数据
import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.random.randint(0,5,20).reshape((4,5)),columns=['b','a','d','c','e'])
df.ix[2,3] = np.NaN
剔除缺失数据
#--方法1:推荐方法
print df.dropna()
#--方法2:对数据非常了解时可使用
print df[~df['c'].isnull()]
填补缺失数据
#--方法1:全量填充
print df.fillna(77)
#--方法2:个性填充(推荐)
print df.fillna({'c':88})
附:不论是剔除,还是填补缺失数据,最后都需要做如下操作,例:
df = df.fillna({'c':88})
网友评论