总结
如果我们不太了解我们所拥有的数据,但是想要将他们分组来观察他们的表现,聚类是个不错的选择;
如果我们想要进行预测,通常使用回归的方法。在使用回归方法是,通常最先尝试最为简单的线性回归;
如果想要基于数据的历史类别和特性对它们进行再分类,通常使用决策树。
具体了解
聚类算法(无监督学习)
聚类技术能够把数据分为多个组,是的组间差异大,组内差异小。这是一种无监督学习的方法,能够找出数据间逻辑上的联系。聚类算法通常用于哪些我们对原始数据的各项指标不了解的情况,通过聚类结果,分析组内和组间的数据有助于找出数据的内在联系。
决策树
决策树常常被用于企业中的分类、预测场景。决策树的是有层次的树形结构,利于理解和解释。例如:销售部门可能会利用决策树方法来分析获得用户的方法。
线性回归
线性回归是最古老但是最常用的回归方法。线性回归通常用于得出解释变量和被解释变量之间的关系。通过回归结果,我们可以对被解释变量进行预测。他们可以是连续型也可以是离散型的。
网友评论