美文网首页
R语言与关联规则挖掘—购物篮分析

R语言与关联规则挖掘—购物篮分析

作者: 姚的日志 | 来源:发表于2019-02-21 09:03 被阅读6次

    名词:

    挖掘数据集:购物篮数据

    挖掘目标:关联规则

    关联规则:啤酒=>尿布(支持度0.02,置信度0.6)

    支持度:所有数据中有2%的购物记录包含了啤酒和尿布

    置信度:所有包含啤酒的购物记录里有60%包含尿布

    最小支持度阈值和最小置信度阈值。

    项集:项(商品)组成的集合

    K-项集:k个项组成的集合

    频繁项集:满足最小支持度的项集

    强关联规则:满足最小支持阈值和最小置信度阈值的规则

    步骤:

    找出所有频繁项集;由频繁项集产生强关联规则。

    案例:

    TID为购物记录,List of item_ID为商品ID,如第T100条购物记录中,包含商品I1,I2,I5。

    最后推出的关联规则有:

    (以上图片来源薛毅老师的《r modeling》)

    R语言操作:

    包:arules

    数据集:Groceries(内置数据集)

    函数:inspect:显检查,示一个的文集或一个术语文档矩阵的详细信息。查看数据。

             apriori:提取关联规则

    代码:

    相关文章

      网友评论

          本文标题:R语言与关联规则挖掘—购物篮分析

          本文链接:https://www.haomeiwen.com/subject/jpvlyqtx.html