美文网首页
数据挖掘——关联分析

数据挖掘——关联分析

作者: skullfang | 来源:发表于2018-01-08 16:11 被阅读0次

前言

关联规则是人类认知客观事物形成的一种认知模式。人们可以从庞大的事物个体中发现一个或者多个的关联。从而建立出关联规则。就像一个因果关系一样,就像我们看到恶狗就想到 可能会咬人(本人对狗无恶意),按下开关的按钮灯就会开。这些事物本身是没有联系的。但是人们可以从中学到一个关联规则。那么机器如何学的到呢?就像每本BI(商业职能)教材或者数据挖掘教材都会讲到的“啤酒和尿布”的案例,这两个本身毫无联系的东西怎么会关联到一起呢?

频繁模式

模式

关联关联,不能说自己与自己关联吧。总得有两个以上得个体,但是个体与个体之间即使有关联 也应该是一个无序得组合。这个组合就叫模式。

支持度和置信度

频繁模式就是频率很高的模式。
怎么判断这个频率呢?
那就是支持度和置信度

支持度:就是这个组合出现在总样本中的百分比。比如总样本中这个组合出现所占百分比是50%。那么支持度就是50%。
置信度::就是一个顺序性,不如模式是(A、B)那么拥有A的一定拥有B。那么就说拥有A后拥有B的置信度为100%。反过来,拥有B后拥有A的概率是40% 那就说。拥有B后拥有A的置信度是40%。

表达的高大上一点就是:
A=>B [support=50%, confidence=100%]
B=>A [support=50% ,confidence=40%]

结论:支持度和置信度都高于阈值的模式称为频繁模式。

相关文章

  • [转]Spark购物篮分析:关联规则挖掘

    1、浅谈数据挖掘中的关联规则挖掘 2、Hadoop/MapReduce购物篮分析:关联规则挖掘 3、Spark购物...

  • 2019-01-13

    1. 关联 关联, 指的是关联分析, 这里引用百度百科的定义. 关联分析又称关联挖掘,就是在交易数据、关系数据或其...

  • 数据挖掘——关联分析

    前言 关联规则是人类认知客观事物形成的一种认知模式。人们可以从庞大的事物个体中发现一个或者多个的关联。从而建立出关...

  • 典型关联分析(CCA)原理总结(转自刘建平Pinard)

    典型关联分析(Canonical Correlation Analysis,以下简称CCA)是最常用的挖掘数据关联...

  • Python数据挖掘012-关联规则

    关联规则挖掘是数据挖掘中第三个比较大的类别。 关联规则分析也称为购物篮分析,最早是为了发现超市销售数据库中不同的商...

  • 零售业的数据挖掘

    数据挖掘的任务和方法 数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘 的任务主要是关联分析、...

  • 不会大数据,也能读懂关联分析

    关联分析(规则)即挖掘关联现象,从大量数据当中发现事物、特征或者数据之间的,频繁出现的相互依赖关系和关联关系。关联...

  • 第一章 数据挖掘基础

    数据挖掘的基本任务:分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐数据挖掘建模过程:1)定义挖掘目标...

  • 关联规则(二)

    参考:数据挖掘入门系列教程(五)之Apriori算法Python实现Python 极简关联分析(购物篮分析) 数据...

  • 数据挖掘- 关联分析算法

    关联分析,顾名思义就是找出哪几项之间是有关联关系的,举个例子: TID购物记录1面包、牛奶2面包、尿布、啤酒、鸡蛋...

网友评论

      本文标题:数据挖掘——关联分析

      本文链接:https://www.haomeiwen.com/subject/zdkzwxtx.html