1、机器学习基础
2、kNN近邻算法
是分类数据最简单有效的算法。缺点:训练数据集很大的时候必须使用大量存储空间,且必须对数据集中的没一个数据进行距离计算,非常耗时,且无法给出任意数据的基础结构信息。
3、决策树
决策树分类器就像带有终止块的流程图,终止块表示分类结果。是一种贪婪算法,他要在给定的时间内做出最佳选择,但并不关心能否达到全局最优。
缺点:当类别太多时,错误可能就会增加的比较快。
4、朴素贝叶斯
贝叶斯提供了一种利于已知值来估计未知概率的有效方案
5、Logistics回归
用一条直线对数据点进行拟合,这个拟合过程就称作回归。
根据现有数据对分类边界线建立回归公式,以此进行分类。
6、支持向量机SVM
svm是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析,泛化错误率较低。
7、AdaBoost元算法
AdaBoost算法十分强大,它能够快速处理其他分类器很难处理的数据集
8、回归
与分类一样,回归也有预测目标值的过程。回归预测连续型变量,而回归预测离散型变量。回归是统计学中最有力的工具之一。
9、树回归CART
数据集中经常包含一些复杂的相互关系,是的输入数据和目标变量之间呈现非线性关系。一般采用树结构来对这种数据建模,相应的,若叶节点使用的模型是分段常数则称为树回归,若叶节点使用的模型是线性回归方程则为模型树。
网友评论