美文网首页
基于Apriori算法的菜品订单关联规则(matlab实现)

基于Apriori算法的菜品订单关联规则(matlab实现)

作者: littlePi的简简 | 来源:发表于2020-04-20 18:14 被阅读0次

    一、Apriori算法分析

    Apriori算法是关联规则最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集。 Apriori算法是最经典的挖掘频繁项集的算法,第一次实现了在大数据集上可行的关联规则提取,其核心思想是通过连接产生候选项与其支持度然后通过剪枝生成频繁项集。 Apriori算法的思想 Apriori算法的主要思想是找出存在于事务数据集中的最大的频繁项集,在利用得到的最大频繁项集与预先设定的最小置信度阈值生成强关联规则。 Apriori算法实现的两个过程 过程一:找出所有的频繁项集。 在这个过程中连接步和剪枝步互相融合,最终得到最大频繁项集 。 连接步 连接步的目的是找到K项集。 剪枝步 剪枝步紧接着连接步,在产生候选项 的过程中起到减小搜索空间的目的。 连接步: (1)对给定的最小支持度阈值,分别对1项候选集,剔除小于该阈值的的项集得到 1项频繁集; (2)下一步由自身连接产生 2项候选集,保留中满足约束条件的项集得到 2项频繁集,记为; (3)再下一步由与连接产生3项候选集,保留中满足约束条件的项集得到3项频繁集,记为。 …… 这样循环下去,得到最大频繁项集。 剪枝步: 剪枝步紧接着连接步,在产生候选项的过程中起到减小搜索空间的目的。 由于是与连接产生的,根据Apriori的性质频繁项集的所有非空子集也必须是频繁项集,所以不满足该性质的项集将不会存在于,该过程就是剪枝。 Apriori算法的实现的两个过程 过程一:找出所有的频繁项集。 过程二:由频繁项集产生强关联规则 由过程一可知未超过预定的最小支持度阈值的项集已被剔除,如果剩下这些规则又满足了预定的最小置信度阈值,那么就挖掘出了强关联规则。

    二、建立模型

    下面根据对某家餐厅的菜品订单数据的分析来实现对Apriori算法关联规则的挖掘过程,数据库中的部分点餐数据如下:

    下面对点餐数据进行了整合,挑选出据有代表性的10位消费者的点餐记录,根据菜品id绘制表格,为了方便对比,这里把{1055,1109,1156,1031,988}记为{a,b,c,d,e}

    四、举例

    五、实现:

    相关文章

      网友评论

          本文标题:基于Apriori算法的菜品订单关联规则(matlab实现)

          本文链接:https://www.haomeiwen.com/subject/txcvbhtx.html