分类和回归
分类的主要任务是将实例数据分到合适的分类中。
回归主要用于预测数值型数据,比如说数据拟合曲线:通过给定数据点的最优拟合曲线。
分类和回归属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。
非监督学习
与监督学习相对应的是非监督学习,此时数据没有类别信息,也不会给定目标值。在非监督学习中,将数据集合分成由类似的对象组成的多个类的过程称为聚类;将寻找描述数据统计值的过程称之为密度估计。此外,非监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观的展示数据信息。
监督学习的用途:
朴素贝叶斯算法 | 局部加权线性回归 |
---|---|
k-临近算法 | 线性回归 |
支持向量机 | Ridge回归 |
决策树 | Lasso最小回归系数估计 |
无监督学习的用途:
k-均值 | 最大期望算法 |
---|---|
DBSCAN | Parzen窗设计 |
网友评论