美文网首页
Pandas4.处理丢失数据

Pandas4.处理丢失数据

作者: bokli_dw | 来源:发表于2020-02-03 16:59 被阅读0次

    pandas4 处理丢失的数据#

    没有数据的数据模块,用np.nan进行填充

    import numpy as np
    import pandas as pd

    dates = pd.date_range('20200203',periods=6)
    df = pd.DataFrame(np.arange(24).reshape(6,4),index = dates,columns=list('ABCD'))

    df.iloc[0,1]=np.nan
    df.iloc[1,2]=np.nan
    print(df)

    处理丢失数据,按照行丢掉

    df.dropna()

    print(df.dropna(axis=0,how='all'))#how= any and all#any只要出现一个nan,把整个行都丢掉,all是说只有全部的行数据为nan时才把整个行丢掉
    print(df.dropna(axis=1,how='any'))

    df.fillna(value=0)填充数据
    print(df.fillna(value=0))#检查是否有缺失数据#df.isnull()
    print(df.isnull())#如果表格很大
    print(np.any(df.isnull())==True)#np.any是说至少有一个是==true的。如果返回值是true,说明一堆数据中至少有一个是丢失的数据,即至少有一个是缺失值。

    运行结果:


    image.png

    相关文章

      网友评论

          本文标题:Pandas4.处理丢失数据

          本文链接:https://www.haomeiwen.com/subject/nwzhxhtx.html