异常检测,英文成为abnormal detection 。这类问题包括银行欺诈,结构缺陷,医疗问题,文本错误等问题。异常也被称之为离群点,噪声,偏差。
有三大类异常检测的方法:
1.无监督的学习,比如说k均值聚类,寻找出比较特殊的案例。
2.有监督的学习,在有异常标签的基础之上,进行构建分类器,识别出新的异常数据。
3.半监督的问题:给定一个正常行为的数据集合,表示正常行为的模型。
常用方法
-
基于密度的方法,最近邻居法,局部异常因子
-
基于子空间与相关性的高维数据的孤立点检测。
-
支持向量机
-
神经网络
-
基于聚类分析的孤立点检测
-
关联规则学习
-
基于模糊逻辑的孤立点检测
-
运用特征袋分数归一化与不同多样性来源的集成方法
网友评论