关联分析(4):购物篮数据转换R语言

作者: 三猫后端 | 来源:发表于2018-10-28 22:20 被阅读5次

    原文链接:关联分析(4):购物篮数据转换R语言

    微信公众号:机器学习养成记    搜索添加微信公众号:chenchenwings


    在进行关联分析时,有时需要根据需求将数据转换为购物篮数据,本篇文章我们将介绍数据进行数据转换的情况及如何在R语言中完成相应操作。

    适用情形

    我们现在有这样一份数据,记录了近173万用户的爱好情况(数据为随机生成)。数据中每行为一个用户,每列为一个爱好属性,“y”代表有此爱好,“n”代表无此爱好,我们希望通过关联分析找出用户会倾向于同时具有哪些爱好。数据保存为csv格式,并导入R中。

    此份数据中,绝大部分取值为“n”,“y”数量偏少,如果直接进行关联分析,会得到如下结果:

    可见,结果得到的是同时不具有的爱好规则,与想要结果不符。因此我们需要将数据转换为购物篮数据,即如下形式的数据:

    R语言实现

    要将数据从原来的格式转换为购物篮数据,首先将“n”全部转换为NA,然后使用arules包中的as(…,"transactions")函数。

    d<-read.csv("guanliandata.csv")

    d[d=="n"]<-NA

    trans3 <- as(d, "transactions")

    data_rules1<-apriori(data=d,parameter =list(support=0.03,confidence=0.3,minlen=2))

    inspect(sort(data_rules1,by="support"))

    最终可得到结果:

    同样的方法也可把matrix,list型数据转换为购物篮数据格式,具体可以通过help("transactions-class")进行查看。

    可关注微信回复:guanliandata获得案例中数据


    推荐文章

    · Bagging算法(R语言)

    ·静态爬虫与地址经纬度转换(python)

    ·特征工程(一):前向逐步回归(R语言)

    ·聚类(三):KNN算法(R语言)

    ·小案例(六):预测小偷行为(python)

    ·ggplot2:正负区分条形图及美化

    扫描二维码,关注我们。

    如需转载,请在开篇显著位置注明作者和出处,并在文末放置机器学习养成记二维码和添加原文链接。

    快来关注我们吧!

    相关文章

      网友评论

        本文标题:关联分析(4):购物篮数据转换R语言

        本文链接:https://www.haomeiwen.com/subject/xwzmtqtx.html