上一篇介绍了分类和回归两类任务,这两类任务是按照机器学习可以解决的问题来分类的,下面我按照机器学习在算法上进行分类。
- 监督学习
- 非监督学习
- 半监督学习
- 增强学习
监督学习
给机器学习的训练数据拥有“标记”或者“答案” MNIST数据集.PNG第一行到最后一行都有“标记”(1.2.3...8.9)
监督学习是给定了机器数据的特征,又给定了机器数据正确的“答案”
- 图像已经拥有了标定的信息
- 银行已经积累了一定的客户信息和他们信用卡的信用情况
- 医院已经积累了一定的病人信息和他们最终确诊是否患病情况
- 市场积累了房屋的基本信息和最终成交的金额
监督学习算法:
- k近邻
- 线性回归和多项式回归
- 逻辑回归
- SVM
- 决策树和随机森林
非监督学习
非监督学习.PNG给机器的训练数据没有任何“标记”或者“答案”
非监督学习的意义
聚类分析.PNG- 对没有“标记”的数据进行分类 - 聚类分析
- 对数据进行降维处理
- 特征提取:信用卡的信用评级和人的胖瘦无关?
- 特征压缩:PCA算法
- 尽量少的损失信息的情况下将高维降为低维度,提升机器学习的运行效率,但不影响机器学习的准确率
-
降维处理的意义:方便可视化
可视化.PNG
人类对于高纬度的空间是不可以理解的,有时候把高维数据降低,可以直观的对数据进行理解
-
异常检测
异常检测.PNG
有一些数据是有异常的,图中的红点是有异常的,这种点不能反应事物的一般性。相应的算法剔除这种异常点
半监督学习
一部分数据有“标记”或者“答案”,另一部分数据没有
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测
增强学习
根据周围环境的情况,采取行动,根据采取行动的结构,学习行动方式。 增强学习.PNGAgent 算法
reward 奖赏
state 惩罚
action 行动
environment 环境
AlphaGo就是在对局中进行增强学习。
增强学习:
- 无人驾驶
-
机器人(强人工智能机器人)
机器人.PNG
网友评论