美文网首页
技巧 | Pandas 数据填充

技巧 | Pandas 数据填充

作者: biogeeker | 来源:发表于2021-02-19 21:02 被阅读0次

课程学习:Pandas 数据处理基础入门

数据填充

除了直接填充值,我们还可以通过参数,将缺失值前面或者后面的值填充给相应的缺失值。例如使用缺失值前面的值进行填充:

df.fillna(method='pad')

或者是后面的值:

df.fillna(method='bfill')

可以看到,连续缺失值也是按照前序数值进行填充的,并且完全填充。这里,我们可以通过 limit= 参数设置连续填充的限制数量:

df.fillna(method='pad', limit=1)  # 最多填充一项

除了上面的填充方式,还可以通过 Pandas 自带的求平均值方法等来填充特定列或行。举个例子:

df.fillna(df.mean()['C':'E']) # 对 C 列到 E 列用平均值填充

插值填充

插值是数值分析中一种方法。简而言之,就是借助于一个函数(线性或非线性),再根据已知数据去求解未知数据的值。插值在数据领域非常常见,它的好处在于,可以尽量去还原数据本身的样子。我们可以通过 interpolate() 方法完成线性插值。

df_interpolate = df.interpolate()
df_interpolate

对于 interpolate() 支持的插值算法,也就是 method=。下面给出几条选择的建议:

  • 如果你的数据增长速率越来越快,可以选择 method='quadratic'二次插值。
  • 如果数据集呈现出累计分布的样子,推荐选择 method='pchip'
  • 如果需要填补缺省值,以平滑绘图为目标,推荐选择 method='akima'

其他用法

除了上面提到的一些方法和技巧,实际上 Pandas 常用的还有:

--- End ---

相关文章

  • 技巧 | Pandas 数据填充

    课程学习:Pandas 数据处理基础入门[https://www.lanqiao.cn/courses/906/l...

  • pandas 数据预处理

    pandas 数据加载 pandas 数据查看 pandas 非编码数据编码 去重 空值 空值 --- >> 填充...

  • 入门Pandas,你必须掌握的技巧

    入门Pandas,必须掌握的技巧 总结自己经常使用的pandas操作方法: 创建DataFrame数据 查看数据相...

  • Pandas4.处理丢失数据

    pandas4 处理丢失的数据# 没有数据的数据模块,用np.nan进行填充 import numpy as np...

  • 数据分析工具PANDAS技巧-如何删除数据帧的列

    数据分析工具PANDAS技巧-如何删除数据帧的列 在本教程中,我们将介绍如何从pandas数据帧(datafram...

  • Office 学习笔记

    1. 笔记目录 快捷键 录入日期 填充 快速填充 智能填充 (2013) 获取数据 手动录入数据技巧 电子表格的通...

  • pandas学习-3

    Pandas数据结构Series:基本技巧 数据查看 / 重新索引 / 对齐 / 添加、修改、删除值

  • pandas操作技巧

    本文中记录Pandas操作技巧,包含: 导入数据 导出数据 查看、检查数据 数据选取 数据清洗 数据处理:Filt...

  • 课程2.7Dataframe:基本技巧

    【课程2.7】 Pandas数据结构Dataframe:基本技巧数据查看、转置 / 添加、修改、删除值 / 对齐...

  • Python & Pandas 常用及各种坑

    Python字典键值互换 输出固定长度字符串,前面用0填充 Pandas使用concat合并数据后groupby有...

网友评论

      本文标题:技巧 | Pandas 数据填充

      本文链接:https://www.haomeiwen.com/subject/ndjimktx.html