美文网首页
The Bitter Lesson by Sutton

The Bitter Lesson by Sutton

作者: 辣么大大大大 | 来源:发表于2019-05-19 15:56 被阅读0次

分享Sutton的一篇博客。Sutton是强化学习的大拿,经典的算法RTDP就是他提出的。

痛苦的教训

文章链接 the bitter lesson

今天又读了一遍Richard Sutton的这篇博客。在这篇博客中,Sutton总结了AI研究的近几十年取得的进步的原因和教训。

文章中称AI取得显著的进步靠的不是依赖人的领域知识(例如象棋、围棋、语音识别),而是靠算力、搜索和学习(Search and Learning)。试图将人的领域知识解决问题短期内会取得一定效果,但长期看,取得长足进步的方法是不依赖于领域知识的。例如语音识别,一帮语言学家搞了几十年都没什么效果,离实用还差的很远,在贾里尼克提出了基于统计的语音识别方法后,语音识别才有了实用的可能。

Sutton说:

we should build in only the meta-methods that can find and capture this arbitrary complexity. Essential to these methods is that they can find good approximations, but the search for them should be by our methods, not by us. We want AI agents that can discover like we can, not which contain what we have discovered. Building in our discoveries only makes it harder to see how the discovering process can be done.

Sutton也认同强化学习采用元学习的方法(Learning to Learn)。在下面这篇综述文章中,介绍了“强化学习的快与慢”,提到了 episodic-meta RL(事件-元强化学习) 接下来可以看看:

Reinforcement Learning, Fast and Slow

相关文章

  • The Bitter Lesson by Sutton

    分享Sutton的一篇博客。Sutton是强化学习的大拿,经典的算法RTDP就是他提出的。 痛苦的教训 文章链接 ...

  • 读《Rich Sutton - The Bitter Less

    2020-02-07Link Two methods: The methods that leverage com...

  • 苦痛的教训

    作者:Rich Sutton 最近看了多篇文章,都有提到这篇 Sutton 写的文章。就找来看看,而似乎也没见人翻...

  • 《任正非传》感言

    When I read "Ren Zhengfei", with "eat bitter, bitter in t...

  • bitter

    小时候本以为吃够了学习上的苦,长大后就会少吃一些生活上的哭。

  • Reinforcement Learning 第十一周课程笔记

    This week watching *Options. * The readings are Sutton, P...

  • bitter  sweet

    有一个人,深藏于心底。必要时,拿出来,便讲述了整个青春 ...

  • bitter sweet

    躺在床上听着窦靖童的《bitter sweet》,蓝调的舒缓和她细腻而慵懒的嗓音,让我的心思终于沉淀下来了,这么多...

  • Bitter Love

    Bitter Love 苦恋 友情提示:一个关于苦恋(单恋)的故事 画风奇诡,群魔乱舞 重口翻译腔 一 在剑与魔法...

  • Bitter Sweet

    初一的第一天,在一个坐满陌生人的教室里,我一眼就关注到了L。他坐在倒数第二排,小麦色的皮肤,虽然离得远,但...

网友评论

      本文标题:The Bitter Lesson by Sutton

      本文链接:https://www.haomeiwen.com/subject/njrqzqtx.html