1、数据预处理
代码:
# Data Preprocessing
# install.packages('arules')
library(arules)
dataset = read.csv('Market_Basket_Optimisation.csv', header = FALSE)
dataset = read.transactions('Market_Basket_Optimisation.csv', sep = ',', rm.duplicates = TRUE)
导入的数据.PNG
处理后的数据.PNG
2、预览数据信息确定参数
代码:
summary(dataset)
itemFrequencyPlot(dataset, topN = 10)
数据基本信息.PNG
一周购买频率.PNG
3、聚合先验模型
代码:
# Training Apriori on the dataset
rules = apriori(data = dataset, parameter = list(support = 0.003, confidence = 0.2))
我们会不断地调整参数,当我们发现某些相关度不是很大的食物聚在一起,就要调整信息度,当我们想提高提升度,就要想办法将数据集的筛选范围变大。
4、可视乎先验模型
代码:
# Visualising the results
inspect(sort(rules, by = 'lift')[1:10])
0.03&0.2.PNG
0.04&0.2.PNG
我们可以通过减小信息度,增大提升度,可以通过增加最小支持度,虽然此时提升度会减小,但是相关的食物都是购买频率比较高的。
商家综合商场的大小布局,确定哪些食物应该放到一起,哪些食物应该不放到一起。
网友评论