pandas4 处理丢失的数据#
没有数据的数据模块,用np.nan进行填充
import numpy as np
import pandas as pd
dates = pd.date_range('20200203',periods=6)
df = pd.DataFrame(np.arange(24).reshape(6,4),index = dates,columns=list('ABCD'))
df.iloc[0,1]=np.nan
df.iloc[1,2]=np.nan
print(df)
处理丢失数据,按照行丢掉
df.dropna()
print(df.dropna(axis=0,how='all'))#how= any and all#any只要出现一个nan,把整个行都丢掉,all是说只有全部的行数据为nan时才把整个行丢掉
print(df.dropna(axis=1,how='any'))
df.fillna(value=0)填充数据
print(df.fillna(value=0))#检查是否有缺失数据#df.isnull()
print(df.isnull())#如果表格很大
print(np.any(df.isnull())==True)#np.any是说至少有一个是==true的。如果返回值是true,说明一堆数据中至少有一个是丢失的数据,即至少有一个是缺失值。
运行结果:
image.png
网友评论