美文网首页
一、RL基础概念介绍

一、RL基础概念介绍

作者: 开发小白宋大喵 | 来源:发表于2018-09-10 22:14 被阅读0次

1.基本概念

  • Agent:智能体
  • System Environment:系统环境/实验的操控者
  • Observation/State:观察值(Agent眼中环境的状态)
  • Action:行动/Agent的反映
  • Reward:回报/反馈

在经典强化学习中,智能体要和环境完成一系列交互
(1)在每一个时刻,系统都将处于一种状态
(2)智能体将设法得到环境当前状态的观察值
(3)智能体根据观察值,结合自己历史的行为准则(策略,Policy)做出行动。
(4)这个行动会影响环境的状态,是环境发生一定的改变。Agent将从改变后的环境中得到两部分信息:新的环境观测值和行为给出的回报。Agent可以根据新的观测值做出新的行动。

2.强化学习两个特点

(1)不断试错
(2)看重长期回报

相关文章

  • 一、RL基础概念介绍

    1.基本概念 Agent:智能体 System Environment:系统环境/实验的操控者 Observati...

  • Q-learning和SARSA及SARSA(λ)

    概念 前置知识:RL基础[https://www.jianshu.com/p/19f77a973dc6] Q le...

  • android IPC机制讲解(二)

    IPC基础概念介绍 介绍一下IPC中的一些基础概念,主要包含三个方面内容:Serializable接口,Parce...

  • IPC基础概念介绍

    2.3 IPC基础概念介绍 本节主要介绍IPC中的一些基础概念,主要包含三方面的内容;Serializable接口...

  • vue基础概念介绍

    组件化 vue的组件化是指把传统的html, css, js资源集成到一个.vue文件中,组成一个单独的组件,被其...

  • IPC基础概念介绍

    本文先讲下Parcelable和Serializable,下篇文章在将Binder,然后再说多进程的处理方式,只有...

  • SSO基础概念介绍

    SSO (Single Sign On) 单点登录(SingleSignOn,SSO),就是通过用户的一次性鉴别登...

  • RabbitMQ 基础概念进阶

    上一篇 RabbitMQ 入门之基础概念 介绍了 RabbitMQ 的一些基础概念,本文再来介绍其中的一些细节和其...

  • 2.3 IPC基础概念介绍(一)

    1. Serializable接口 定义User类,实现Serializable接口 序列化和反序列化 打印结果:...

  • windows下安装强化学习开源库 tf2rl

    一、TF2RL介绍 TF2RL是一个深度强化学习库,它使用TensorFlow 2.0实现了各种深度强化学习算法。...

网友评论

      本文标题:一、RL基础概念介绍

      本文链接:https://www.haomeiwen.com/subject/cubsgftx.html