线性回归,用线去拟合数据,预测连续值
逻辑回归(对数几率回归,简称对率回归),用来解决分类问题
正则化,解决过拟合问题
神经网络
模型评估,偏差,方差
类偏斜误差度量,查准率和查全率
支持向量机,最大边界分类,核函数
聚类,无监督学习,k-均值算法,需要选择聚类数,选择最靠近自己的数据,然后计算均值,选择最靠近自己的数据,然后计算均值,如此循环
降维,主成分分析(PCA),把所有的数据投射到该向量上获得的均方误差尽可能小
异常检测,利用高斯分布(正态分布),如果数据未落在某个规定的阈值之内,便认为该数据异常
推荐系统,大型数据集的学习,随机梯度下降,小批量梯度下降,在线学习,map reduce 和 数据并行(分布式计算,开源平台hadoop)
应用实例:图片文字识别,上限分析(确定哪部分是对于算法来说提高最大,进而花最大时间在那上面)
网友评论