用机器学习炒币系列之四-无监督学习与强化学习

作者: 御风弄影er | 来源:发表于2018-05-17 23:29 被阅读0次

用机器学习炒币系列之四-无监督学习与强化学习
基础
强化学习(Q-funcation,DQN)基本介绍
TensorFlow从零开始学(一)机器学习基础
机器学习分类
机器学习的分类
分类
【2019-07-16】机器学习基础
机器学习框架梳理(笔记汇总)
2019-11-01 机器学习的基础概念

上回我们说到了监督学习，今天，我们给聊聊机器学习算法的另外两类：无监督学习与强化学习。

无监督学习是用“未标记”的数据描述隐藏结构函数的机器学习任务。由于给与学习者提供的实例没有标签，因此不存在对算法输出的结构的准确性评估——这是区分无监督学习与监督学习、强化学习的一种方式。

下图所示是一个无监督学习的实例：

在本例中，所要实现的是机器阅读。训练数据为一系列无标记的文本数据，由这些无标记的数据训练出函数模型。之后向该函数输入训练数据中的某个文本，则可输出函数模型所理解的文本含义。

强化学习是受行为心理学启发的机器学习领域，涉及智能体如何在环境中采取行动以得到最大累积奖励的概念。这个问题，由于它的普遍性，已在很多学科中进行了研究，例如博弈论、控制论、运筹学、信息论、基于仿真的优化、多智能体系统、群体智能、统计学以及遗传算法。在运筹学以及控制论的研究文献中，强化学习被称为近似动态规划。该方法已研究了最优控制理论，但大多数研究主要关注的是最优解的存在及性质，而非学习或近似。

下图所示是一个强化学习的实例：