机器学习的一点经验

作者: Shuailong | 来源:发表于2017-12-05 23:19 被阅读27次
数据篇
  1. 对于不熟悉的任务或者数据,一定要小心仔细地检查数据的各种性质、各种分布,对数据的各项指标了如指掌。
  2. 仔细检查数据的过程中,得到一些重要的直觉,记录下来。
  3. 数据的预处理非常重要。预处理的时候结合最佳实践和模型需求进行。
模型篇
  1. 建立模型时,不要急于用代码实现。先和师兄或者导师讨论,充分以后再实现。
  2. 从最简单的模型开始。一步一步加大模型的复杂性,而不使性能下降。
  3. 对于复杂的模型,先选取一小部分数据进行检验。小数据拟合的很好以后,再进行大数据的测试。
实现篇
  1. 代码实现的时候,自上而下/快速迭代同时使用。初期尽量少地使用模块化以保证灵活性。
  2. 代码实现的时候,如果Github有类似实现,一定先阅读现有的方法。避免重新造轮子/实现过于复杂/实现错误。
  3. 代码实现的时候进行单元测试。提交代码之前先通过尽量完整的测试。
训练篇
  1. 先试用最简单的优化器,比如带有动量的梯度下降法,不奏效以后再使用更高阶的优化器。
  2. 利用好损失曲线和结果曲线,来观察模型的学习过程。如果曲线过于震荡,考虑加大batch的大小。如果在训练集上太难拟合,考虑减少模型参数;增加特征。如果训练集拟合的很好,开发和测试集效果不好,考虑使用十折交叉法检验训练和测试集的分布是否一致。
  3. 根据曲线来调整学习率。学习率是最重要的超参数之一。
学习篇
  1. 保证不时阅读顶会论文/最新论文,掌握最新的研究动向。
  2. 阅读论文和代码实现同步进行,加深对文章的理解,提高实现能力。
其他
  1. 尽量多地与导师沟通。掌握主动权。频率至少两周一次。
  2. 对于导师布置的任务,尽可能快速完成。如果屡次不能得到好的结果,一定及时和导师汇报。否则会导致导师不敢把其他的任务交给自己。
  3. 要一直学习不能松懈。

相关文章

  • 机器学习的一点经验

    数据篇 对于不熟悉的任务或者数据,一定要小心仔细地检查数据的各种性质、各种分布,对数据的各项指标了如指掌。 仔细检...

  • 2019-03-31

    《机器学习实战》--增強学习(代码未经验证)

  • 《西瓜书笔记》(1)机器学习概述

    《西瓜书》指的是周志华老师的《机器学习》著作 什么是机器学习? 机器学习致力于通过计算的手段,利用经验来改善系统自...

  • 【西瓜书读书笔记】第一章 绪论

    一、机器学习研究内容 机器学习致力于研究如何通过计算的手段,利用经验来改善自身的性能。由于经验通常以数据的形式存在...

  • Machine Learning学习笔记(一)

    所谓机器学习,也就是机器自身的学习,致力于通过计算的手段,利用经验来改善自身的性能。计算机系统里,“经验”通...

  • 面试经验(机器学习)

    常见分类模型( svm,决策树,贝叶斯等)的优缺点,适用场景以及如何选型 解决过拟合的方法有哪些? KNN(分类与...

  • 面试经验(机器学习)

    常见分类模型( svm,决策树,贝叶斯等)的优缺点,适用场景以及如何选型解决过拟合的方法有哪些? KNN(分类与回...

  • 机器学习简介

    机器学习是什么? 机器学习教计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“...

  • 【机器学习】(一)机器学习基础

    基本概念 机器学习(Machine Learning) 机器学习研究的内容是关于在计算机上从数据/经验(data/...

  • 机器学习基础概念

    一、什么是机器学习? 简单来说,机器学习是机器通过观察数据积累经验来获取技能(改进一些性能指标)的过程。 二、机器...

网友评论

    本文标题:机器学习的一点经验

    本文链接:https://www.haomeiwen.com/subject/lyphixtx.html