强化学习

强化学习

作者: 加油11dd23 | 来源:发表于2021-04-04 23:05 被阅读0次

强化学习笔记（1）--概述
基础
强化学习基础知识详解
强化学习基础篇（一）强化学习入门
强化学习+关系抽取论文阅读
单步强化学习在糖豆推荐系统的应用
强化学习读书笔记 - 01 - 强化学习的问题
2019年上半年收集到的人工智能强化学习干货文章
强化学习——基础概念
什么是强化学习（Reinforcement Learning）

https://www.cnblogs.com/pinard/p/9714655.html
https://zhuanlan.zhihu.com/p/360146610
https://www.bilibili.com/video/BV1UE411G78S?p=6
https://zhuanlan.zhihu.com/p/93404190
https://datawhalechina.github.io/easy-rl/

一、简介

概括来说，RL要解决的问题是：让agent学习在一个环境中的如何行为动作(act)，从而获得最大的奖励值总和(total reward)。
这个奖励值一般与agent定义的任务目标关联。

agent需要的主要学习内容：
第一是行为策略(action policy)，第二是规划(planning)。
其中，行为策略的学习目标是最优策略，也就是使用这样的策略，可以让agent在特定环境中的行为获得最大的奖励值，从而实现其任务目标。

行为(action)可以简单分为：

连续的：如赛车游戏中的方向盘角度、油门、刹车控制信号，机器人的关节伺服电机控制信号。
离散的：如围棋、贪吃蛇游戏。 Alpha Go就是一个典型的离散行为agent。

（一）、基本结构

image.png

image.png

二、方法介绍

http://fancyerii.github.io/books/rl1/
https://zhuanlan.zhihu.com/p/25239682
https://zhuanlan.zhihu.com/p/61731174

（一）、value-based

1、Q-learning

2、Sarsa

3、Deep Q network

image.png

image.png

（二）、policy-based

https://www.youtube.com/watch?v=z95ZYgPgXOY
https://zhuanlan.zhihu.com/p/75174892

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

（三）、目前AutoML模型压缩最常用的强化学习算法

bilibili李宏毅2020强化学习

1、A3C最基础的actor-critic算法

image.png

image.png

image.png

2、Reinforce（离散策略梯度）

3、DDPG（连续策略梯度）

https://github.com/TianhaoFu/easy-rl
https://blog.csdn.net/kenneth_yu/article/details/78478356

image.png

相关文章

强化学习笔记（1）--概述
目录：强化学习问题强化学习的组成智能体的组成强化学习分类强化学习一些重要概念 1. 强化学习问题面向智...
基础
什么是强化学习？强化学习是机器学习的一个分支。机器学习分为监督学习，无监督学习，强化学习。强化学习简单来说，...
强化学习基础知识详解
强化学习（Reinforcement Learning）强化学习基本概念强化学习四要素：状态(state)、动...
强化学习基础篇（一）强化学习入门
强化学习基础篇（一）强化学习入门本文主要基于David Silver的强化学习基础课程进行总结回归梳理强化学习的...
强化学习+关系抽取论文阅读
2019 层次强化学习做关系抽取 ---12018 强化学习做关系抽取 ---22018 深度强化学习做关系抽...
单步强化学习在糖豆推荐系统的应用
1.强化学习基础 1.1 强化学习概念强化学习通常用马尔科夫决策过程(Markov Desicision Pro...
强化学习读书笔记 - 01 - 强化学习的问题
请看原文强化学习读书笔记 - 01 - 强化学习的问题
2019年上半年收集到的人工智能强化学习干货文章
2019年上半年收集到的人工智能强化学习干货文章从0到1-强化学习篇关于人工智能中强化学习的扫盲强化学习简介...
强化学习——基础概念
机器学习分为：监督学习、非监督学习、强化学习。下面从强化学习的概念、应用、特点等方面带大家认识强化学习，让大家对强...
什么是强化学习（Reinforcement Learning）
阅读笔记，来自莫烦PYTHON的强化学习教程，原文地址。强化学习是机器学习的一大类，使用强化学习可以让计算机学习如...

网友评论

本文标题：强化学习

本文链接：https://www.haomeiwen.com/subject/wqnlkltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|强化学习|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！