1,常用关联规则算法
2,详解Apriori算法
2.1 概念
关联规则的一般形式:
支持度:项集A, B同时发生的概率成为A, B的支持度。 也就是项集A,B同时发生的概率。
Support(A=>B) = Support(B=>A) = P(A∩B) = A,B 同时发生的事务个数 / 所有事务个数
置信度:项集A发生,则项集B发生的概率成为A=>B的置信度。
Confidence(A=>B) = P(B | A) = P(A∩B) / P(A)
提升度:一种简单的关联度度量
Life(A,B) = Life(B,A) = P(B | A) / P(B) = P(A | B) / P(A) = P(A∩B) / P(A)*P(B)
Life(A,B) = 1 事件A,B 无关联
Life(A,B) <= 1 事件A,B 负关联
Life(A,B) >= 1 事件A,B 正关联
最小支持度,最小置信度
项集,频繁项集,最大频繁项集
网友评论