算法思路
- 利用Apriori算法,计算闭频繁项集,与频繁项集上满足置信度约束的关联规则
- 数据降维
2.1 记产生的闭频繁项集大小为,对每个闭频繁项集求出相似集
2.2 对关联规则集中每条规则,求出D中支持r前项和后项的记录集合
2.3 迭代降维- 2.3.1 从闭频繁项集中选取一个子集
- 2.3.2 利用项集子集生成事务相似集。计算关联规则集与相似集的反映度
- 2.3.3 迭代得到每个闭频繁项集反映度最高的子集,即目标降维属性子集
- 异常点检测
3.1 计算规则的否定集
3.2 计算每个否定集中数据点p到簇中与其最邻近的k个数据点中最远点的距离
3.3 计算数据点p的k关系领域,对中每一点进行判断。计算论文中p的k关系邻域中不符合规则r行为模式点的平均密度,与簇中不符合规则r行为模式点的平均密度比较,实现异常点检测
网友评论