1、回归
算法名:线性回归
算法描述:
① 使用数据去拟合函数 ,并优化目标函数均方误差最小
应用中的问题:对于非线性的问题效果不好,而现实中的问题往往是非线性的
算法名:逻辑回归
算法描述:
① 使用数据去拟合函数 ,并优化目标函数负对数似然函数:
2、聚类
算法名:K-means
算法描述:
① 先随机初始化 k 个点,然后分别计算各个数据到这 k 个点的距离,然后分别将各个数据归类到某个距离最小的点,作为一类
② 计算每个类内的数据的均值作为中心点,重复过程 ①
③ 重复过程 ②,直到中心点的位置不再变化,或者迭代次数达到指定的值
应用中的问题:因为是随机初始化 k 个点,所以模型的学习效果具有很大的随机性
算法名:密度聚类 DBSCAN
详细可见:
https://www.cnblogs.com/PJQOOO/p/11838288.html
https://www.cnblogs.com/pinard/p/6217852.html
应用中的问题:调参比较困难
3、因子
4、关联
5、决策树
6、神经网络
网友评论