0.机器学习回顾:
监督学习:
从训练数据中学习模型,对测试数据进行预测 监督:每个样本均有一个已知的输出项(类标签)
(1)分类模型(分类器):二分类,多分类 决策树算法,KNN算法,SVM算法,感知机,神经网络 逻辑斯特回归(分类模型,主要二分类,ovr-one vs rest) 朴素贝叶斯(分类模型,求解分类概率)
(2)回归模型(回归器):输出变量是连续值的情况
线性回归:简单线性回归、多元线性回归
非监督学习:人们给机器一大堆没有分类标记的数据,让机器可以对数据进行分类、检测异常
非监督:不关注类标签(不关注样本的输出) 注意:如果数据是有标签的,是否可以进行无监督学习?
答案是没有问题的
(1)聚类分析:KMean
(2)数据降维(特征提取):PCA,SVD,LDA
PCA主成分分析==>(数据降维)
相当于数据的压缩,特征的提取
把相关的特征压缩,从而形成我们的二维特征。
SVD奇异值分解
隐含狄利克雷分布(Latent Dirichlet Allocation,以下简称LDA
网友评论