前言

关联规则是人类认知客观事物形成的一种认知模式。人们可以从庞大的事物个体中发现一个或者多个的关联。从而建立出关联规则。就像一个因果关系一样，就像我们看到恶狗就想到可能会咬人（本人对狗无恶意），按下开关的按钮灯就会开。这些事物本身是没有联系的。但是人们可以从中学到一个关联规则。那么机器如何学的到呢？就像每本BI（商业职能）教材或者数据挖掘教材都会讲到的“啤酒和尿布”的案例，这两个本身毫无联系的东西怎么会关联到一起呢？

频繁模式

模式

关联关联，不能说自己与自己关联吧。总得有两个以上得个体，但是个体与个体之间即使有关联也应该是一个无序得组合。这个组合就叫模式。

支持度和置信度

频繁模式就是频率很高的模式。
怎么判断这个频率呢？
那就是支持度和置信度

支持度：就是这个组合出现在总样本中的百分比。比如总样本中这个组合出现所占百分比是50%。那么支持度就是50%。
置信度：：就是一个顺序性，不如模式是（A、B）那么拥有A的一定拥有B。那么就说拥有A后拥有B的置信度为100%。反过来，拥有B后拥有A的概率是40% 那就说。拥有B后拥有A的置信度是40%。

表达的高大上一点就是：
A=>B [support=50%, confidence=100%]
B=>A [support=50% ,confidence=40%]

结论：支持度和置信度都高于阈值的模式称为频繁模式。