美文网首页
Pandas4.处理丢失数据

Pandas4.处理丢失数据

作者: bokli_dw | 来源:发表于2020-02-03 16:59 被阅读0次

pandas4 处理丢失的数据#

没有数据的数据模块,用np.nan进行填充

import numpy as np
import pandas as pd

dates = pd.date_range('20200203',periods=6)
df = pd.DataFrame(np.arange(24).reshape(6,4),index = dates,columns=list('ABCD'))

df.iloc[0,1]=np.nan
df.iloc[1,2]=np.nan
print(df)

处理丢失数据,按照行丢掉

df.dropna()

print(df.dropna(axis=0,how='all'))#how= any and all#any只要出现一个nan,把整个行都丢掉,all是说只有全部的行数据为nan时才把整个行丢掉
print(df.dropna(axis=1,how='any'))

df.fillna(value=0)填充数据
print(df.fillna(value=0))#检查是否有缺失数据#df.isnull()
print(df.isnull())#如果表格很大
print(np.any(df.isnull())==True)#np.any是说至少有一个是==true的。如果返回值是true,说明一堆数据中至少有一个是丢失的数据,即至少有一个是缺失值。

运行结果:


image.png

相关文章

网友评论

      本文标题:Pandas4.处理丢失数据

      本文链接:https://www.haomeiwen.com/subject/nwzhxhtx.html