楔子:先验算法是关联规则学习的一种,关联规则学习顾名思义就是学习某些事物之间的关联性,或者某些行为之间的关联性。
1、先验算法是什么
一个购商场发现在晚饭后的时间里,买尿布的人会买啤酒,就像买面包的人会买牛奶,我们可以把面包和牛奶放在一起方便顾客购买,也可以把面包和牛奶放在超市的两端,让顾客看到其他商品。
先验算法就是要通过数字分析出两个行为之间的相关性。
2、两个案例帮助你理解
第一个例子中我们想看出观影者所看电影的关联性。
第二个例子中我们想看出市场购物的关联性。
3、三个重要参数
支持度就是观看目标电影的人数和总人数之比。表现的电影的热度。
信息水准就是观看过M1和M2两部电影的人数和只看过M1电影的人数之比。表示的是两部电影的关联度。
提升度是信息水准与支持度之比,信息水准是M1->M2,支持度是M2的支持度。表示的是电影M1的人群中看电影M2的人数与总人群中看电影M2的人数的比值。是宣传的有效性。
4、先验算法原理
第一步中我们确定一个最小支持度和最小信息水准。
第二步中我们确定所欲支持度大于最小支持度的行为。
第三步我们确定所有信息水准高于最小信息水准的关联关系。
第四步我们按照提升度递减的规则排列这些关联关系。
网友评论