强化学习

强化学习

作者: D_Major | 来源:发表于2019-05-09 15:24 被阅读0次

强化学习笔记（1）--概述
基础
强化学习基础知识详解
强化学习基础篇（一）强化学习入门
强化学习+关系抽取论文阅读
单步强化学习在糖豆推荐系统的应用
强化学习读书笔记 - 01 - 强化学习的问题
2019年上半年收集到的人工智能强化学习干货文章
强化学习——基础概念
什么是强化学习（Reinforcement Learning）

s - state, a - action, r - reward
长期持有(或持有多头, holding long)是一种状态, 告诉我们股票是否是长期持有的, 也可能是持有空头(holding short)
每日回报既可以作为状态作为参考, 也可以作为奖励

马尔科夫决策问题包含:

一组潜在状态S
一组潜在行动A
转移函数T[s, a, s'] # s'概率分布之和必须是1, 代表下一个状态, 其概率分布能带来有用的信息.
奖励函数R[s, a]
强化学习属于马尔科夫决策问题, 其任务是找出使奖励最大化的策略π(s), 最优策略称为π*(s), 其中两个算法是策略迭代和值迭代

当转移函数和奖励函数未知时:

$<s_1, a_1, s_1', r_1>$ 称为一个体验元组(experience tuple)
有两种方法得到策略π:

模型相关的强化学习
通过查看转移统计数据构建模型T[s, a, s'], 以及对奖励求均值构建模型R[s, a], 获得这些模型后通过策略迭代或值迭代解决问题
模型无关的强化学习
Q-Learning

折扣回报

考虑到1美元的未来价值(货币贬值), 无穷步数的回报是逐渐减少的, 要乘系数λ, 系数λ和利率类似, 表示回报是折扣的.

无限步数后可以获取, 有限步数10步也可以获取, 设置折扣回报仍可以获取

相关文章

强化学习笔记（1）--概述
目录：强化学习问题强化学习的组成智能体的组成强化学习分类强化学习一些重要概念 1. 强化学习问题面向智...
基础
什么是强化学习？强化学习是机器学习的一个分支。机器学习分为监督学习，无监督学习，强化学习。强化学习简单来说，...
强化学习基础知识详解
强化学习（Reinforcement Learning）强化学习基本概念强化学习四要素：状态(state)、动...
强化学习基础篇（一）强化学习入门
强化学习基础篇（一）强化学习入门本文主要基于David Silver的强化学习基础课程进行总结回归梳理强化学习的...
强化学习+关系抽取论文阅读
2019 层次强化学习做关系抽取 ---12018 强化学习做关系抽取 ---22018 深度强化学习做关系抽...
单步强化学习在糖豆推荐系统的应用
1.强化学习基础 1.1 强化学习概念强化学习通常用马尔科夫决策过程(Markov Desicision Pro...
强化学习读书笔记 - 01 - 强化学习的问题
请看原文强化学习读书笔记 - 01 - 强化学习的问题
2019年上半年收集到的人工智能强化学习干货文章
2019年上半年收集到的人工智能强化学习干货文章从0到1-强化学习篇关于人工智能中强化学习的扫盲强化学习简介...
强化学习——基础概念
机器学习分为：监督学习、非监督学习、强化学习。下面从强化学习的概念、应用、特点等方面带大家认识强化学习，让大家对强...
什么是强化学习（Reinforcement Learning）
阅读笔记，来自莫烦PYTHON的强化学习教程，原文地址。强化学习是机器学习的一大类，使用强化学习可以让计算机学习如...

网友评论

本文标题：强化学习

本文链接：https://www.haomeiwen.com/subject/imjwoqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|强化学习|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！