机器学习之强化学习，机器的自我学习。

作者: AI女神安娜 | 来源:发表于2019-06-17 19:56 被阅读6次

机器学习之强化学习，机器的自我学习。
基础
机器学习入门
强化学习是这样一种学习
机器学习-线性回归（单变量）与梯度下降法应用
AI学习笔记之——强化学习(Reinforcement Lear
TensorFlow从零开始学(一)机器学习基础
Machine Learning: 十大机器学习算法
Machine Learning: 十大机器学习算法
强化学习dqn系列梳理--从入门到进坑

前言

最近一些读者私聊我，说什么是强化学习，那今天就简单的讲一下什么是强化学习。

就拿最近的618来说，在宝贝推荐场景中，阿里巴巴使用了深度强化学习与自适应在线学习，通过持续机器学习和模型优化建立决策引擎，对海量用户行为以及百亿级商品特征进行实时分析，帮助每一个用户迅速发现宝贝，提高人和商品的配对效率。所以大家看到各种商品都会有那么一种想买的冲动。

先说到机器学习。

机器学习可以大致分为四类：

监督学习

无监督学习

半监督学习

强化学习

监督学习是利用标记了的样本进行学习，无监督学习则是使用未标记的样本进行学习，这两个是我们最常见的。半监督学习则是样本中只有少量带标记的样本，多数样本都未标记，利用这些样本进行学习。强化学习则是很不同的一种学习方式，它没有规则的训练样本和标签，主要通过奖励和惩罚达到学习的目的。

什么是强化学习？

《最强大脑》曾经有个挑战项目叫蜂巢迷宫，挑战者不断尝试不断试错。强化学习做法也类似，它主要包含三个概念：状态、动作和回报。同样是以迷宫为例，智能体所在的位置即是状态，从某个位置向某方向走一步则为动作，比如可以向左向右或向上向下，每走一步会产生回报，比如撞到墙就是负回报，好的动作则会带来正回报。而且不仅要关注当前的回报，还要关注长期的回报，通过不断试错学习到一个长期回报的动作序列。

强化学习是机器学习的主要学习方法之一，智能体从环境到行为的学习，也就是如何在环境中采取一些列行为，才能使得奖励信号函数的值最大，即获得的累积回报最大。

强化学习不同于监督学习，监督学习通过正确结果来指导学习，而强化学习通过环境提供的信号对产生的动作的好坏做一种评价，它必须要靠自身经历进行学习。学习后智能体知道在什么状态下该采取什么行为，学习从环境状态到动作的映射，该映射称为策略。

强化学习的特点：

它是试错学习，因为它没有像监督学习一样的直接指导信息，所以它只能不断去跟环境交互不断试错来获取最佳策略。

它的回报具有延迟性，因为它往往只能在最后一个状态才能给出指导信息，这个问题也让回报的分配更加困难，即在得到正回报或负回报后怎么分配给前面的状态。

强化学习的运用：

比如飞行器的飞行控制。

比如控制机器人的行走。

比如学习怎么玩游戏。

比如学习怎么理财投资。

比如学习怎么下棋。

机器学习之强化学习，机器的自我学习。
前言最近一些读者私聊我，说什么是强化学习，那今天就简单的讲一下什么是强化学习。就拿最近的618来说，在宝贝推荐...
基础
什么是强化学习？强化学习是机器学习的一个分支。机器学习分为监督学习，无监督学习，强化学习。强化学习简单来说，...
机器学习入门
机器学习：发展与未来人工智能 > 机器学习 > 深度学习 > 神经网络多种机器学习技术：深度学习，强化学习，蒙...
强化学习是这样一种学习
强化学习是机器学习的一种。机器学习从直觉上听起来像是让机器像人类一样学习，但是实际上，只有强化学习才与人类的学习...
机器学习-线性回归（单变量）与梯度下降法应用
机器学习(Machine Learning) 机器学习主要由监督学习、非监督学习、半监督学习、强化学习等组成。监...
AI学习笔记之——强化学习(Reinforcement Lear
姓名：张庆庆学号：19021211151 嵌牛导读：机器学习第三类强化学习嵌牛鼻子：机器学习强化学习嵌牛提...
TensorFlow从零开始学(一)机器学习基础
TensorFlow从零开始学 [toc] 机器学习基础人工智能机器学习分类有监督学习无监督学习半监督学习强化...
Machine Learning: 十大机器学习算法
机器学习算法分类：监督学习、无监督学习、强化学习基本的机器学习算法：线性回归、支持向量机(SVM)、最近邻居(K...
Machine Learning: 十大机器学习算法
机器学习算法分类：监督学习、无监督学习、强化学习基本的机器学习算法：线性回归、支持向量机(SVM)、最近邻居(K...
强化学习dqn系列梳理--从入门到进坑
标签：强化学习深度学习机器学习 Deep Qlearning DQN 人工智能一、基础知识强化学习可以划分...

机器学习之强化学习，机器的自我学习。

相关文章

机器学习之强化学习，机器的自我学习。

基础

机器学习入门

强化学习是这样一种学习

机器学习-线性回归（单变量）与梯度下降法应用

AI学习笔记之——强化学习(Reinforcement Lear

TensorFlow从零开始学(一)机器学习基础

Machine Learning: 十大机器学习算法

Machine Learning: 十大机器学习算法

强化学习dqn系列梳理--从入门到进坑

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

大数据，机器学习，人工智能

AI时代

大数据爬虫Python AI Sql

人工智能/模式识别/机器学习精华专题

机器学习和人工智能入门