美文网首页
结构化机器学习项目杂谈

结构化机器学习项目杂谈

作者: JPlino | 来源:发表于2017-09-30 17:51 被阅读0次

学自吴恩达的深度学习课程

机器学习性能

  • 开始会上升很快,但当超过人类的表现的时候,速度开始变的平缓
  • 性能会有一个理论上界,就是 Bayes optimal error ,不可能被超越
当机器的性能比人类差的时候,可以:
  • 从人类获取更多的标记数据
  • 人工误差分析,了解为什么人类能够做对,机器就不能
  • 更好的分析偏差和方差

端到端的深度学习

  • 用单个神经网络代替多个学习阶段
  • 语音识别 --- 提取特征 --- 单词元音 --- 单词 --- 文本
    深度学习end to end 直接从 input 到 output , 即从audio 到 text
  • 有一个前提,数据要足够多,不然旧的系统获取表现的更好
  • 有时分成多步可能更好,比如 人脸识别, 先识别出人脸的位置,再识别出人脸的身份。(分出的两个任务都有足够的训练数据)
  • 对于无人驾驶来说,单纯的end to end 是不足以去学习到比较好的效果的,多阶段的方式或许是更好的选择。
Pros:
  • 让数据直接说话,没有人类的干预
  • 更少的人工设计
Cons:
  • 需要大量的数据
  • 排除了可能有用的手工设计组件(手工的就是直接将知识注入学习系统当中 )
Choice:
  • 关键的问题:是否有足够的数据去学习从x 到 y 的end to end 的映射。

多任务学习

  • 一个网络进行多个任务
  • 相比较之下,迁移学习的使用更多,都是因为数据量不够,需要的其他的任务学到的知识作为补充。
  • 训练时,不管数据的标签是否完整,都可以进行训练
什么时候有意义:
  • 一系列的任务能够共享一些低层次的特征
  • 每一个任务的数据量很接近,如果要专注于多个人任务中的一个任务时,其他的任务加起来的数据量要必须大的多,才能对单个任务提供有用的知识。(类似于迁移学习)
  • 可以训练一个足够大的神经网络来同时在所有任务上取得好的表现
  • 多任务学习会降低性能的唯一情况是:神经网络还不够大???,如果足够大的神经网络,性能很少会比单任务神经网络低

相关文章

网友评论

      本文标题:结构化机器学习项目杂谈

      本文链接:https://www.haomeiwen.com/subject/npxnextx.html