美文网首页简友广场想法散文
rapidminer进行关联分析、分类预测、聚类分析

rapidminer进行关联分析、分类预测、聚类分析

作者: Cache_wood | 来源:发表于2021-07-11 07:29 被阅读0次

商品交叉销售关联分析

Step1:检查数据缺失值、异常值
Step2:约减数据集中属性
Step3:FP-Growth找到频繁项集
Step4:产生关联规则

FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则



但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。

我们适当放宽min support = 0.5和min confidence = 0.6



发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108

泰塔尼克号幸存者分类预测

step1:角色设定
step2:加入决策树操作符
step3:对测试数据集预测
step4:交叉检验


confidence = 0.5时的class precision = 76.52%和83.33%。



例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。

调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。

gini_index参数


gain_ratio参数

Iris鸢尾花数据集聚类分析

step1:选择a1和a2属性
step2:添加K-means聚类操作符
step3:调整聚类个数,查看散点个数,人工评价聚类效果。

得到每个点的聚类结果



可视化表示聚类分析

此处选择的聚类个数是3,即k = 3



若选择聚类个数为5



聚类分析 k = 5

相关文章

  • rapidminer进行关联分析、分类预测、聚类分析

    商品交叉销售关联分析 Step1:检查数据缺失值、异常值 Step2:约减数据集中属性 Step3:FP-Grow...

  • Python数据挖掘010-分类与回归建模

    数据挖掘可以大概分为:分类与回归,聚类分析,关联规则,时序模式,异常检测等模型。 分类主要是预测分类标号,即离散属...

  • 数据挖掘任务

    预测建模 分类:离散 回归:连续 关联分析 聚类分析 异常检测仪 练习题: 1.以下是否是数据挖掘任务。 a.根据...

  • 第一章 数据挖掘基础

    数据挖掘的基本任务:分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐数据挖掘建模过程:1)定义挖掘目标...

  • 第五章-挖掘建模

    经过数据探索和数据预处理,得到了可以直接建模的数据。数据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、...

  • 第五章 挖掘建模

    经过数据探索与数据预处理,得到了可以直接建模的数据。根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、...

  • 挖掘建模概述

    1、概述 1.1数据挖掘的基本任务 基本任务包括分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法...

  • 《python数据分析与挖掘实战》之挖掘建模

    经过数据探索与数据预处理,我们得到了可以直接建模的数据。根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规...

  • 共词分析

    共词分析分类 共词聚类分析最近邻等算法 共词关联分析关联规则相关算法 共词词频分析统计 突发词检测法相对增长率突然...

  • 第五天:聚类分析与判别分析

    聚类分析、判别分析 聚类分析和判别分析有相似的作用,都是起到分类的作用。但是,判别分析是已知分类然后总结出判别规则...

网友评论

    本文标题:rapidminer进行关联分析、分类预测、聚类分析

    本文链接:https://www.haomeiwen.com/subject/lvktpltx.html