1.线性回归
1.1一元线性回归
y=a+bx
1.2多元线性回归
y=a+b1x1+b2x2+...+bnxn
2.KNN算法
KNN是k最邻近算法,是一种lazy learning(懒惰学习),也就是说KNN在实现的过程中,不会建立模型。个人理解:在预测一个点的时候,不想线性回归那样,先用训练集训练出一个y=a+bx,训练后a和b就是确定的值,当预测一个新的点的时候可以直接将此点带入公式中。而KNN不建立模型,也就是当预测新的点的时候,他会将此点和所有的训练集做比较,然后选出K个最近的点,最后用投票准则,做出预测。
3.SVM
3.1线性SVM
支持向量就是在两个类的边界上的点,线性可分的时候就是找到支持向量中间的那条直线。
3.2线性不可分的SVM
线性不可分,我们用一个映射函数,映射到高维空间中。然后在高维空间中找一个线性超平面。
4.kmeans算法
对初始点选择有关,容易陷入局部最优
这个算法其实很简单,最主要的是你选择什么度量方程式,也就是说你选择什么规则进行分类,是选择距离,还是相似度进行分类?选择好度量方程式之后,你就对每个中心点计算到所有点的值,然后将这些值放在一个矩阵中,当你对所有中心点计算完成之后,每个点距离哪个中心点最近,他就属于哪个类。
机器学习
网友评论