美文网首页
表征学习+强化学习

表征学习+强化学习

作者: 臻甄 | 来源:发表于2021-08-04 15:40 被阅读0次

Firstly,我们先谈谈表征学习

  • wikipedia给出的定义大概是:表征学习(又称特征学习 representation learning)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。
  • 瓶颈:(1)以前都是手工提取特征,但很困难、很昂贵、很耗时、并依赖于强大专业知识。(2)深度神经网络虽然可以有效地学到数据丰富的特征,但特征难以解读。通常神经网络层数越多,训练成本也越高。
  • 和预测学习不同:不是搞预测,就是因为现在的输出比如图片、视频、语言、声音等等都是高维且冗余复杂的,传统的手动提取特征已经变得不切合实际,所以需要借助优秀的特征学习技术。
  • 类似机器学习,特征学习可以被分为两类:
    (1)监督式特征学习:有标记的数据
    (2)无监督式特征学习:主成分分析、自动编码、矩阵分解、聚类分析

历史

  • 100多年前就是说要高数据特征学习
  • 1901年,Karl Pearson提出主成分分析(Principal Component Analysis),用线性投影的方法学习数据的低维度特征
  • 1936年,Ronald Fisher提出了线性判别分析(Linear Discriminant Analysis)
  • 之后,PCA和LDA有各种各样的变形如:核PCA(kernel PCA)、广义判别分析(Generalized Discriminant Analysis)也相继提出。
  • 2000年,机器学习社区兴起了流形学习(Manifold Learning)即发掘高维数据中的内在结构。
  • 基于神经网络的线条是在1986年发现反向传播算法可以在隐藏层里学习到关于输入数据的内在表征
  • 2006年,Geoffrey Hinton提出贪婪分层预训练和深度神经网络微调的方法,解决了神经网络用于特征学习的两大难题
    (1)模型过拟合 Model Overfitting
    (2)梯度扩散Gradient Diffusion
  • 现状:对于图像,大家会先使用训练好的深度神经网络模型(如VCG,ResNet等)提取特征信息,再用于强化学习(RL),视觉导航(Visual Navigation)任务等等。
    表征学习历史:from 《An Overview on Data Representation Learning: From Traditional Feature Learning to Recent Deep Learning》2017

参考一篇博客OFENet

博客地址

motivation

  • RL采样效率低下
  • 直接从obs->action,很容易被很多无用信息干扰,一般RL只有2-3层,很难学

current application:一般通过辅助任务学习state representation

contribution

  • 前提:state的维度越低,RL的效果越好(经验)
  • 动机:用足够少的,state表达足够多的统计信息
  • 文章提出一种逆向思维,在完成state压缩抽象的情况下,提高内在state的维度可以提高效果。

相关论文

表征学习+强化学习相关论文

表征学习相关论文

  • 1901 Karl Pearson发表主成分分析的论文
    On lines and planes of closest fit to systems of points in space.

  • 1936 Ronald Fisher发表最早期的线性判别分析论文
    The use of multiple measurements in taxonomic problems.

  • 1943 Warren McCulloch and Walter Pitts 创建了第一个人工神经元模型
    A logical calculus of the ideas immanent in nervous activity.

  • 1958 Frank Rosenblatt建立了世界上第一个两层神经网络用于二元分类
    The perceptron: A probabilistic model for information storage and organization in the brain.

  • 1974 Paul Werbos提出了反向传播(Backpropagation)算法用于训练多层感知器
    Beyond regression: New tools for prediction and analysis in the behavioral sciences.

  • 2006 Geoffrey Hinton提出贪婪分层预训练和深度神经网络微调的方法
    A fast learning algorithm for deep belief nets. Neural computation

未来方向

  • 我们可以利用深度神经网络学习丰富的特征来表示环境的模型,然后通过基于模型的深度强化学习(Model-based Deep Reinforcement Learning) 训练机器人(Robotics)来慢慢靠近通用人工智能......

相关文章

  • 表征学习+强化学习

    Firstly,我们先谈谈表征学习 wikipedia给出的定义大概是:表征学习(又称特征学习 represent...

  • 5-17 每个成长者,必须学会刻意练习

    【WHAT】刻意练习,是在学习区内通过一定地训练的方式,来获得并强化心理表征的过程。通过刻意练习,培养和强化你调用...

  • 基础

    什么是强化学习? 强化学习是机器学习的一个分支。 机器学习分为监督学习,无监督学习,强化学习。 强化学习简单来说,...

  • 强化学习笔记(1)--概述

    目录: 强化学习问题 强化学习的组成 智能体的组成 强化学习分类 强化学习一些重要概念 1. 强化学习问题 面向智...

  • 学习“心理表征”用“心理表征”学习

    学习“心理表征” 用“心理表征”学习 今日阅读《刻意练习》第三章“心理表征”,为了便于理解,采用了边阅读边完善思维...

  • 强化学习基础知识详解

    强化学习(Reinforcement Learning) 强化学习基本概念 强化学习四要素:状态(state)、动...

  • 强化学习基础篇(一)强化学习入门

    强化学习基础篇(一)强化学习入门 本文主要基于David Silver的强化学习基础课程进行总结回归梳理强化学习的...

  • 科学课笔记039

    科学课笔记039 强化学习的过程:通过对正确的行为给予奖励,错误的行为给以惩罚,从而获得正确的行动模式。表征的概念...

  • 强化学习+关系抽取论文阅读

    2019 层次强化学习做关系抽取 ---12018 强化学习做关系抽取 ---22018 深度强化学习做关系抽...

  • 强化学习——基础概念

    机器学习分为:监督学习、非监督学习、强化学习。下面从强化学习的概念、应用、特点等方面带大家认识强化学习,让大家对强...

网友评论

      本文标题:表征学习+强化学习

      本文链接:https://www.haomeiwen.com/subject/jhgevltx.html