先验算法-R

作者: 灵妍 | 来源:发表于2018-04-07 19:34 被阅读1次
    1、数据预处理

    代码:

    # Data Preprocessing
    # install.packages('arules')
    library(arules)
    dataset = read.csv('Market_Basket_Optimisation.csv', header = FALSE)
    dataset = read.transactions('Market_Basket_Optimisation.csv', sep = ',', rm.duplicates = TRUE)
    
    导入的数据.PNG
    处理后的数据.PNG
    2、预览数据信息确定参数

    代码:

    summary(dataset)
    itemFrequencyPlot(dataset, topN = 10)
    
    数据基本信息.PNG
    一周购买频率.PNG
    3、聚合先验模型

    代码:

    # Training Apriori on the dataset
    rules = apriori(data = dataset, parameter = list(support = 0.003, confidence = 0.2))
    

    我们会不断地调整参数,当我们发现某些相关度不是很大的食物聚在一起,就要调整信息度,当我们想提高提升度,就要想办法将数据集的筛选范围变大。

    4、可视乎先验模型

    代码:

    # Visualising the results
    inspect(sort(rules, by = 'lift')[1:10])
    
    0.03&0.2.PNG 0.04&0.2.PNG

    我们可以通过减小信息度,增大提升度,可以通过增加最小支持度,虽然此时提升度会减小,但是相关的食物都是购买频率比较高的。
    商家综合商场的大小布局,确定哪些食物应该放到一起,哪些食物应该不放到一起。

    相关文章

      网友评论

        本文标题:先验算法-R

        本文链接:https://www.haomeiwen.com/subject/hjoyhftx.html