1.监督学习
supervised learning
是因为我们为这个算法在训练集上标注了类别
也就是说有标准问题和标准答案
回归:预测变量连续的 比如根据房屋面积预测租金价格
分类:预测变量是离散的,例如只取0和1的情况
支持向量机这样的算法可以处理无限种特征
2.learning theory
什么样的算法,多大的训练集
3.unsupervised learning
聚类问题 例如对像素进行分组 计算机视觉,图像处理,例如将2D变为3D图像(监督和非监督)
例如将混合的声音分离(我们最初并不能给出确切的答案,不能使用监督算法)
独立组件分析
文本处理
4.reinforcement learning强化学习
例如无人机飞行控制
回报函数 如何尽可能获得更好的回报和更小的惩罚
网友评论