学习的主线是《机器学习入门到实战MATLAB实践应用》
作者:冷雨泉、张会文、张伟等
1、机器学习基础
数据集、样本集
分类:结果为离散值时,如“成熟”、“不成熟”为二分类, 涉及多个类别时,成为多分类。
回归:当结果预测值为连续值时,如预测西瓜的成熟度,成为回归。
泛华:指训练的模型不仅适用于训练样本,同时适用于新样本。
2、MATLAB基础入门(机器学习软件仅是工具,我们学校人才培养方案是以python为主线,但这本书将的MATLAB,感觉很好,结合使用)
矩阵运算是核心
3、MATLAB机器学习工具箱
Classification Learner实现分类算法
4、k近邻算法
k近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法之一,
思路:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某个类别,则该样本也属于这个类别。
5、决策树(0730)
https://www.cnblogs.com/luozeng/p/8604997.html
决策树原理实例(python代码实现)
ID3决策树:香农信息熵(entropy)、信息增益量(Information Gain)
C4.5决策树:是ID3的改进算法,属性的选择是依靠“信息增益率”进行的。
6、支持向量机
SVM,Support Vector Machine,以统计学习理论为基础,解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机可以分析数据、识别模式、分类和回归分析。
7、朴素贝叶斯
概率论中的贝叶斯公式、贝叶斯定理, 英国数学家贝叶斯(Thomas Bayes, 1702-1761)
8、线性回归
回归:给出一个点集D,用一个函数去拟合这个点集,并且使得点集与拟合函数之间的误差最小,如果这个函数曲线是一条直线,就称为简单线性回归。
9、逻辑回归(20190731)
https://blog.csdn.net/pandacode/article/details/80435371
求偏导部分没有看明白
数据没有下载完
https://blog.csdn.net/zouxy09/article/details/20319673
这篇文章写得更加深入浅出一点。
sigmod函数、学习率的使用更容易理解(以女生是否喜欢自己为例,不再是简单的喜欢不喜欢,而是喜欢的百分比)
10、神经网络(20190801)
https://www.jianshu.com/p/d6cca5703f54
目前找到的,最容易理解的ANN了。
y=k*x+b做输入输出,
根据样本数据的x->y 随机定义k、b之后做反馈、不断根据结果与预测的偏差做矫正,以适当的循环次数或者精度差作为循环的终止条件。
11、AdaBoost算法
12、K均值算法
13、期望最大化算法
EM算法,bayes,
网友评论