美文网首页
推断与控制的关系

推断与控制的关系

作者: TonnyYan | 来源:发表于2018-10-27 22:38 被阅读7次

推断 = 规划

如何推断?

  1. 计算反向消息:{\beta _t}\left( {{{\mathbf{s}}_t},{{\mathbf{a}}_t}} \right) = p\left( {{O_{t:T}}|{{\mathbf{s}}_t},{{\mathbf{a}}_t}} \right)
  2. 计算策略(最优策略):p\left( {{{\mathbf{a}}_t}|{{\mathbf{s}}_t},{O_{1:T}}} \right)
  3. 计算前向消息:{\alpha _t}\left( {{{\mathbf{s}}_t}} \right) = p\left( {{{\mathbf{s}}_t}|{O_{1:t - 1}}} \right)

其中,Optimal变量服从伯努利分布

Backward pass

Backward pass
从t=T到t=1递归计算

Policy computation

Policy computation
Policy computation with value functions
\alpha用于控制温度,\alpha越小 max就越硬,策略就越确定

Forward messages

Forward messages

Summary

Summary
原先的值迭代、策略迭代算法由max ----> softmax,变成基于能量的形式

相关文章

  • 推断与控制的关系

    推断 = 规划 如何推断? 计算反向消息: 计算策略(最优策略): 计算前向消息: 其中,Optimal变量服从伯...

  • 推断系统

    例:阴影与光源位置的关系这是一个简单的推断

  • 风水学中要掌握的进阶知识:时运、五行及山水环境的吉凶判断

    吉凶推断就是根据飞星布盘的结果,对房屋的吉凶作出推断。主要有三种方式,一是根据时运与五行的关系进行推断;二是根据环...

  • 预防错题集2

    偏倚控制与病因推断 病因的概念 研究设计阶段控制混杂因素的方法没有 分层分析? 病例对照研究和队列研究,为什么都是...

  • Enhanced LSTM for Natural Langua

    一、概述 用于自然语言推断的加强LSTM。顾名思义,这篇论文的目的是做自然语言推断,即推断两个句子的关系,关系有三...

  • 深度学习之路

    一.概率论与统计推断 概率论与统计推断(一) ------ 概率论的基本概念概率论与统计推断(二) ------ ...

  • 笔记:为什么不能迷信经验?

    经验学习之所以有内在缺陷,是因为在经验学习“采取行动,记录结果,推断行动与结果之间的关系,根据推断结论调整下一步行...

  • 与家人的关系

    每个家庭里都有一个迷一样的关系:孩子与家人的关系。 我身边最多的孩子与家长的关系应该就是控制与被控制的关系吧,从前...

  • 概率论与统计推断(四) ------ 统计推断

    本节目标 : 一.概率论与统计推断的关系 二.总体与样本 三.直方图与箱线图(机器学习的数据探索部分会用上) 频率...

  • 2020-11-18 关系中的控制与被控制,你真的是被控制的一方

    与自己的和解,关系中的控制与被控制 深入地看到我和我生命中比较重要的三个人的关系,都涉及到控制与被控制。 一直以来...

网友评论

      本文标题:推断与控制的关系

      本文链接:https://www.haomeiwen.com/subject/wuljtqtx.html