美文网首页
Pandas 处理丢失数据

Pandas 处理丢失数据

作者: 李小夭 | 来源:发表于2019-08-15 16:47 被阅读0次
import pandas as pd
import numpy as np

dates = pd.date_range('20130101',periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index = dates,columns = ['A','B','C','D'])
df

            A   B   C   D
2013-01-01  0   1   2   3
2013-01-02  4   5   6   7
2013-01-03  8   9   10  11
2013-01-04  12  13  14  15
2013-01-05  16  17  18  19
2013-01-06  20  21  22  23

df.iloc[0,1] = np.nan
df.iloc[1,2] = np.nan
print(df)

             A     B     C   D
2013-01-01   0   NaN   2.0   3
2013-01-02   4   5.0   NaN   7
2013-01-03   8   9.0  10.0  11
2013-01-04  12  13.0  14.0  15
2013-01-05  16  17.0  18.0  19
2013-01-06  20  21.0  22.0  23

dropna:如有nan,按行(axis=0)或按列(axis=1)drop

how = {'any','all'}

print(df.dropna(axis = 0, how='any'))

            A     B     C   D
2013-01-03   8   9.0  10.0  11
2013-01-04  12  13.0  14.0  15
2013-01-05  16  17.0  18.0  19
2013-01-06  20  21.0  22.0  23

print(df.dropna(axis = 1, how='any'))
             A   D
2013-01-01   0   3
2013-01-02   4   7
2013-01-03   8  11
2013-01-04  12  15
2013-01-05  16  19
2013-01-06  20  23

fillna:将nan替换成其他值

print(df.fillna(value=0))

            A     B     C   D
2013-01-01   0   0.0   2.0   3
2013-01-02   4   5.0   0.0   7
2013-01-03   8   9.0  10.0  11
2013-01-04  12  13.0  14.0  15
2013-01-05  16  17.0  18.0  19
2013-01-06  20  21.0  22.0  23

isnull:检查是否有nan

print(df.isnull())

                A      B      C      D
2013-01-01  False   True  False  False
2013-01-02  False  False   True  False
2013-01-03  False  False  False  False
2013-01-04  False  False  False  False
2013-01-05  False  False  False  False
2013-01-06  False  False  False  False

# 是否至少包含一个True(用于数据量较大排查是否存在至少一个nan值)
print(np.any(df.isnull()) == True)

True

Pandas学习教程来源请戳这里

相关文章

  • Pandas学习笔记

    pandas笔记 插入pandas 创建序列 创建dataframe 选择数据 设置值 处理丢失数据 导入导出数据...

  • Pandas处理丢失数据

    转载:https://morvanzhou.github.io/tutorials/data-manipulati...

  • Pandas 处理丢失数据

    dropna:如有nan,按行(axis=0)或按列(axis=1)drop how = {'any','all'...

  • pandas_处理丢失数据

    有时候我们导入或处理数据, 会产生一些空的或者是 NaN 数据,如何删除或者是填补这些 NaN 数据就是我们今天所...

  • 3.4 Pandas 处理丢失数据

    学习资料: 相关代码 创建含 NaN 的矩阵 有时候我们导入或处理数据, 会产生一些空的或者是 NaN 数据,如何...

  • python丢失指导入导出数据

    14课时 Pandas 如何处理丢失数据。 很多消失数据。用np.nan。 .dropna(axis=0,how=...

  • Pandas4.处理丢失数据

    pandas4 处理丢失的数据# 没有数据的数据模块,用np.nan进行填充 import numpy as np...

  • Pandas-2019-03-14

    Pandas Pandas 介绍 Pandas主要处理的数据结构 ·系列(Series)·数据帧(DataFram...

  • 《莫烦Python》笔记 -- pandas部分

    3.1 pandas基本介绍 3.2 pandas选择数据 3.3 pandas设置值 3.4 pandas处理缺...

  • Pandas学习笔记

    Pandas 简介 Pandas是Python中进行数据处理的一个常用库,利用Pandas可以高效地处理格式化数据...

网友评论

      本文标题:Pandas 处理丢失数据

      本文链接:https://www.haomeiwen.com/subject/gtazjctx.html