美文网首页
统计-离群值出现时的两种矫正方法

统计-离群值出现时的两种矫正方法

作者: PriscillaBai | 来源:发表于2018-06-07 19:07 被阅读0次

方法一:取log

当数据是呈倍数增加的时候,图会有很多离群值,不好看(图左)。取log2后,数据波动范围变小,但是倍数关系仍存在,如图右。

image.png

取log2的应用场景:

  1. Fold-change
  2. qPCR

同理,若数据以e, 10的倍数增加时,取loge, log10

image.png

方法二:取分位数

大于90%分位数的数据按90%来算,小于10%分位数的数据按照10%来算。

image.png

图左是原始数据,图右是经过分位数校正数据,变得更规整了。

喜欢就点个赞吧,有赞就放出代码。无耻脸:)

相关文章

  • 统计-离群值出现时的两种矫正方法

    方法一:取log 当数据是呈倍数增加的时候,图会有很多离群值,不好看(图左)。取log2后,数据波动范围变小,但是...

  • 2019-10-04数据结果的分析-离群值

    一 定义 离群值分为统计离群值(高度异常值)与歧离值(异常值)。离群值的分类与我们使用的水平有关,一般检出...

  • 多重比较-Bonferroni法和Benjamini & Hoc

    本次笔记主要介绍多重比较下两种常用的矫正P值的方法:Bonferroni法和Benjamini & Hochber...

  • Stata:离群值!离群值?离群值!

    作者:吴世飞 | 连玉君 ( 知乎 | 简书 | 码云 | github ) Stata 现场培训报名中…… 1....

  • 箱线法剔除离群值

    在实际应用中经常会用到剔除离群值的情况,本文提供箱线法剔除离群值的方法,仅限参考:

  • 异常值检测

    异常值也称为离群值,是有些一个或者几个与其他数值差别较大。 (一)统计得方法 1.3σ原则 对于服从正态分布的数据...

  • 异常值检查与处理

    异常值的定义: 异常值,即在数据集中存在不合理的值,又称离群点,如下所示: 异常值判别方法: 1.简单统计法 对属...

  • 特征标准化作用

    1、minmax normalization(最值归一) 该方法会被极大极小离群值影响 from sklearn....

  • BoxPlot的离群值(Outliers)

    数据分析之 – 离群值(Outliers) 一:什么是Outliers Outliers是统计学专业术语,是指相比...

  • Ptyhon Pandas常用的操作

    1 统计空值 下面是统计空值的个数 创建了一个df,输出如下 输出每个数据是否为空值 统计空值的个数,下面两种方式...

网友评论

      本文标题:统计-离群值出现时的两种矫正方法

      本文链接:https://www.haomeiwen.com/subject/unhnsftx.html