📚接上文。
首先创建供测试用的数据集合。
dates = pd.date_range('20130101', periods=6)
df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E'])
df1.loc[dates[0]:dates[1], 'E'] = 1
df1.loc[dates[3]] = np.nan
df1
内容如下:
df1
删除miss值
df1.dropna可以这个函数方便的进行操作。how='any',只要行中有一个nan元素就整行删除。
df1.dropna(how='any')
输出
df1
how='all',只有整行都是nan元素才会整行删除。
df1.dropna(how='all')
输出
df1
填充nan值
可以通过df1.fillna方便的把是nan值的元素进行修改。
df1.fillna(value=5)
修改结果
df1
通过判断nan值,生成mask
pd.isna(df1)
输出
df1的mask
网友评论