2018-07-03 强化学习

2018-07-03 强化学习

作者: 松山剑客 | 来源:发表于2018-07-03 15:07 被阅读3次

2018-07-03 强化学习
强化学习笔记（1）--概述
基础
坚持信念
强化学习基础知识详解
强化学习基础篇（一）强化学习入门
乐观构思、悲观计划、乐观实行
日精进打卡（第361天）
乐观构思，悲观计划，乐观实行
强化学习+关系抽取论文阅读

Learning Multi-Step Robotic Tasks from Observation ^[1]
文章地址
Due to burdensome data requirements, learning from demonstration often falls short of its promise to allow users to quickly and naturally program robots. Demonstrations are inherently ambiguous and incomplete, making a correct generalization to unseen situations difficult without a large number of demonstrations in varying conditions. By contrast, humans are often able to learn complex tasks from a single demonstration (typically observations without action labels) by leveraging context learned over a lifetime. Inspired by this capability, we aim to enable robots to perform one-shot learning of multi-step tasks from observation by leveraging auxiliary video data as context. Our primary contribution is a novel action localization algorithm that identifies clips of activities in auxiliary videos that match the activities in a user-segmented demonstration, providing additional examples of each. While this auxiliary video data could be used in multiple ways for learning, we focus on an inverse reinforcement learning setting. We empirically show that across several tasks, robots can learn multi-step tasks more effectively from videos with localized actions, compared to unsegmented videos.
由于数据需求繁重，从演示中学习往往像其宣称的那样满足其允许用户快速自然地编写机器人程序。演示本质上是模糊的和不完整的，在没有大量的演示的情况下，对未经历过的情况进行泛化是很困难的。相比之下，通过利用一生中所学到的上下文，人类通常能够从单个演示（通常是没有动作标签的观察）中学习复杂的任务。受到这种能力的启发，我们的目标是使机器人能够通过利用辅助视频数据作为上下文来完成从观察到的多步骤任务的单次学习。我们的主要贡献是一种新的动作本地化算法，它可以识别辅助视频中与用户分段演示中活动相匹配的活动的片段，并提供每个示例的示例。虽然这个辅助视频数据可以以多种方式用于学习，但我们关注的是反强化学习。我们的经验表明，在几个任务中，相比未分段的视频，机器人可以更有效地从带有局部动作的视频中学习多步任务。

作者：爱可可_爱生活,链接：https://www.jianshu.com/p/5e3f77712422,來源：简书, ↩

相关文章

2018-07-03 强化学习
Learning Multi-Step Robotic Tasks from Observation [1]文章地...
强化学习笔记（1）--概述
目录：强化学习问题强化学习的组成智能体的组成强化学习分类强化学习一些重要概念 1. 强化学习问题面向智...
基础
什么是强化学习？强化学习是机器学习的一个分支。机器学习分为监督学习，无监督学习，强化学习。强化学习简单来说，...
坚持信念
2018-07-03 （稻盛哲学学习会）打卡第78天姓名：祝新华部门：业务部组别：待定【知～学习】《...
强化学习基础知识详解
强化学习（Reinforcement Learning）强化学习基本概念强化学习四要素：状态(state)、动...
强化学习基础篇（一）强化学习入门
强化学习基础篇（一）强化学习入门本文主要基于David Silver的强化学习基础课程进行总结回归梳理强化学习的...
乐观构思、悲观计划、乐观实行
2018-07-03 （稻盛哲学学习会）打卡第79天姓名：祝新华部门：业务部组别：待定【知～学习】《京...
日精进打卡（第361天）
2018-07-03 姓名：李义公司：........ 组别：259期利他二组【知~学习】背诵六项精进大纲...
乐观构思，悲观计划，乐观实行
2018-07-03 （稻盛哲学学习会）打卡第107天姓名：王燕君部门：分水碶组别：利他三组【知～学习】 ...
强化学习+关系抽取论文阅读
2019 层次强化学习做关系抽取 ---12018 强化学习做关系抽取 ---22018 深度强化学习做关系抽...

网友评论

强化学习每日更新

本文标题：2018-07-03 强化学习

本文链接：https://www.haomeiwen.com/subject/nyoduftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

强化学习每日更新

热点阅读

强化学习每日更新

关于我们|服务条款|联系我们|2018-07-03 强化学习|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！