美文网首页
异常值处理

异常值处理

作者: echolvan | 来源:发表于2020-04-14 11:38 被阅读0次

    使用3西塔准则来识别异常值

    def outRange(Ser1):
        boolInd = (Ser1.mean() - 3*Ser1.std() > Ser1) | (Ser1.mean() + 3*Ser1.std()) < Ser1
        index = np.arange(Ser1.shape[0])[boolInd]
        outrange = Ser1.iloc[index]
        return outrange
    

    3西塔准则具有一定的局限性,因此该原则只对正态分布或近似正态分布数据有效,其他分布无限

    箱线图分析

    QL -1.5IQR或QU+1.5IQR
    QL为下四分位数
    QU为上四分位数

    IQR为上四分位与下四分位的差

    相关文章

      网友评论

          本文标题:异常值处理

          本文链接:https://www.haomeiwen.com/subject/ogjzmhtx.html