美文网首页
【2018-10-07】离群点检测

【2018-10-07】离群点检测

作者: BigBigFlower | 来源:发表于2018-10-08 22:33 被阅读0次

异常检测

全局离群点(显著的偏离数据集中的其余对象)

情境离群点(在特定情境,显著的偏离数据集中的其余对象)

 -----------情境属性

-----------行为属性

-----------局部离群点

集体离群点(数据对象的一个子集形成集体离群点)

(1)统计学方法

        学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为离群点。

(2)基于近邻性的方法

--------------基于距离的离群点检测和嵌套循环方法

令r为距离阈值,π(π∈(0,1])为分数阈值,o是一个DB(r,π)离群点,若:

dist(·,·)距离度量

计算DB(r,π)离群点===循环嵌套

输入:对象集D={o1,o2,o3,...,on},阈值r(r>0),π(π∈(0,1])

输出:D 中的DB(r,π)离群点。

--------------基于网格的方法

cell(数据空间被划分成多维网格)

-------------基于密度的离群点检测

(3)基于聚类的方法

假定正常的数据对象属于大的、稠密的簇、而离群点属于小的或稀疏的簇,或不属于任何簇。

(4)基于分类的方法

构建一个仅描述正常类的分类器,不属于正常类的任何样本都被视为离群点。

(5)挖掘情境离群点和集体离群点

在情境离群点检测中,结构是使用情境属性定义的情境。在集体离群点检测,结构是蕴含的。

(6)高维数据中的离群点检测

主要有三种方法:传统的离群点检测、找出子空间的离群点和对高维离群点建模。

相关文章

  • 【2018-10-07】离群点检测

    异常检测 全局离群点(显著的偏离数据集中的其余对象) 情境离群点(在特定情境,显著的偏离数据集中的其余对象) --...

  • 孤立森林(Isolation Forest)从原理到实践

    异常检测 离群点是在给定数据集中,与其他数据点显著不同的数据点。异常检测是找出数据中离群点(和大多数数据点显著不同...

  • 异常检测之LOF算法

    简介 LOF算法(Local Outlier Factor,局部离群因子检测方法),是一种无监督的离群检测方法,是...

  • 信贷风控实战(六)——异常检测

      异常检测(Outlier Detection / Anomaly Detection),也称之为离群点检测,...

  • 异常检测算法速览(Python代码)

    一、异常检测简介 异常检测是通过数据挖掘方法发现与数据集分布不一致的异常数据,也被称为离群点、异常值检测等等。 1...

  • 异常点/离群点检测算法——LOF

    局部异常因子算法-Local Outlier Factor(LOF) 在数据挖掘方面,经常需要在做特征工程和模型训...

  • 异常点检测方法

    一、基本概念 异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。 常见的异常成因:数据来源于不同的类(异常对象...

  • Python数据挖掘014-离群点检测

    离群点检测是数据挖掘中的第五个经典应用领域。它的任务是发现于大部分其他对象显著不同的对象。 离群点的属性值明显偏离...

  • 异常检测,离群检测,波动点检测(Anomaly/outlier/

    一直有这个疑问,就查询了一下,国内好像没有找到,找到了外文,翻译一下。 异常检测和离群点检测具有相同的含义,只是在...

  • 离群点分析

    LOF算法 使用基于密度的局部离群点检测算法LOF鉴于LOF算法的特点,使用了文献[1]中的DLOF算法,在文献中...

网友评论

      本文标题:【2018-10-07】离群点检测

      本文链接:https://www.haomeiwen.com/subject/nsfuoftx.html