http://blog.csdn.net/u011239443/article/details/78132697
2.1 进行误差分析
标注错误:
2.2 清楚标注错误的数据
纠正错误 dev / test 数据集的方法:
2.3 快速搭建你的第一个系统,并进行迭代
尽快的搭建你的第一个系统。
2.4 在不同的划分上进行训练并测试
对于不同来源的数据,最佳方案可能并不是将其混合。如,我们最终需要预测的数据来自于app,那么 dev / test 数据集应该也要来自于 app。option 2 会是更好的选择:
2.5 不匹配数据划分的偏差和方差
对于三个不同的问题(不匹配数据或者说数据不是相同分布,偏差和方差),我们有不同的策略。为了判断是那种问题,我将 train 和 dev 的合并称为 training-dev,根据人类误差和不同数据集下的误差来判断是什么问题:
总结来说:
2.6 定位数据不匹配
image.png如:
2.7 迁移学习
总结:
2.8 多任务学习
当label向量中的某项y不存在,则不计算该项的交叉熵损失。
多任务学习的适用情况:
左边的是迁移学习的数据情况,右边的多任务学习的。
2.9 什么是端到端的深度学习
例如:
2.10 是否要使用端到端的深度学习
端到端的深度学习的优缺点:
使用端到端的深度学习需要注意的地方:
网友评论