原标题:人工智能研究项目的经验教训:前三年
作者:Eric Jang
译者:尹肖贻
我在Google Brain robotics(现在被称为“Robotics @ Google”)已经工作了近3年。 人当不忘回望过去,我现在整理这几年中,于大型研究项目中学习的科学、工程知识,和个人成果。 每个研究人员的独特经验和实验经历,都可能成为其独特思考方式的竞争优势。 这是到目前为止,我的工作历程。
这些是按时间顺序排列的(最早的作品),以便读者可以看到我过去的经历如何塑造我目前的见解和信仰。有一些论文我没有参与,但却激发了我的观点。 我会在后续博文中提到这些内容; 这篇文章的范围仅限于我自己的研究项目。
![](https://img.haomeiwen.com/i6095449/7afbc48b106f5ba3.png)
Categorical Reparameterization with Gumbel-Softmax
- 谷歌公司鼓励员工的灵感的工作环境,以及20%时间从事个人喜欢的项目,对员工是很有益处的。(Gumbel-Softmax的灵感来自我与Shane Gu在茶水间的闲聊中)【译者按:谷歌公司允许员工在最长20%的工作时间里,参与到与手头工作没有必然联系的项目中。哇!】
- 对最基初的技术(例如生成建模的技术)的研究,可能产生下游应用的巨大进步。
- 实现最简单的方法,是被引用最多的方法。
End-to-End Learning of Semantic Grasping
- “分类标签”的概念毫无意义,是解决目标条件的错误方法。
- 机器学习可以帮助机器人进步,机器人也可以反过来帮助机器学习(即通过当前姿势追溯标记)。
- 快速移动和投资不需要机器人的可视化和分析工具的重要性。
- 训好模型所需要的,不过是高质量的数据和对比度损失。 Pierre Sermanet对两要素津津乐道,甚至可能凭此迎来强人工智能技术。
- 人当有远大的梦想。
Deep Reinforcement Learning for Vision-Based Robotic Grasping
- 快速原型,快速迭代很重要性。
- Q-Learning的可用性和扩展性非常好。
QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation
- 大多数人并不关心QT-Opt是如何训练的; 他们只对训练有素的QT-Opt系统能做什么很兴奋。
- QT-Opt只需要缩放,算力和数据。
Generative Ensembles for Robust Anomaly Detection
- 深入思考OoD问题(超出正常的数据分布)的性质和不同类型的不确定性。
- OoD问题是病态问题,但对实际应用仍然有用。
- OoD和泛化是同一枚硬币的两面。
Grasp2Vec: Learning Object Representations from Self-Supervised Grasping
- 训好模型,只需要高质量的数据和对比度损失。
- 类标签毫无意义。 “(与强调类标签)相反,我们只应当关注图像的真实表现......没有‘勺子’这种东西。有了这样的认识,你就会意识到,图中的东西不是弯曲的‘勺子’,它只是你的一厢情愿”。 摆脱引入明确的人为定义的语义,可以(有些自相矛盾地)让我们解决一个严格的难题。【译者按:类似于佛教徒强调的“破相”。如果你能够意识到类别这样人为标记的概念,仅仅是为了语言上的方便,而非实质,就能获得更多原始信息了】
- 定义良好的损失函数,可以类比为好的“软件2.0”设备:具有模块化功能、能够快速验证正确性、不对上游或下游计算强加假设(与RL算法相反)。
网友评论