美文网首页简友广场想法散文
rapidminer进行关联分析、分类预测、聚类分析

rapidminer进行关联分析、分类预测、聚类分析

作者: Cache_wood | 来源:发表于2021-07-11 07:29 被阅读0次

    商品交叉销售关联分析

    Step1:检查数据缺失值、异常值
    Step2:约减数据集中属性
    Step3:FP-Growth找到频繁项集
    Step4:产生关联规则

    FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则



    但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。

    我们适当放宽min support = 0.5和min confidence = 0.6



    发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108

    泰塔尼克号幸存者分类预测

    step1:角色设定
    step2:加入决策树操作符
    step3:对测试数据集预测
    step4:交叉检验


    confidence = 0.5时的class precision = 76.52%和83.33%。



    例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。

    调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。

    gini_index参数


    gain_ratio参数

    Iris鸢尾花数据集聚类分析

    step1:选择a1和a2属性
    step2:添加K-means聚类操作符
    step3:调整聚类个数,查看散点个数,人工评价聚类效果。

    得到每个点的聚类结果



    可视化表示聚类分析

    此处选择的聚类个数是3,即k = 3



    若选择聚类个数为5



    聚类分析 k = 5

    相关文章

      网友评论

        本文标题:rapidminer进行关联分析、分类预测、聚类分析

        本文链接:https://www.haomeiwen.com/subject/lvktpltx.html