美文网首页
机器学习模型常见对比

机器学习模型常见对比

作者: 史春奇 | 来源:发表于2017-11-03 14:34 被阅读139次

​在“R语言和表数据分析”, 我们对常见的数据预处理流程给出一个大致的解决方案, 在这个基础上, 才能很好的谈数据质量data quality, 否则只是Garbage in garbage out。


大概有70%到80%的时间都会花在数据预处理Data Preprocess上, 然后20%的时间要花在对数据结果的可视化和解释(visualization & interpretation)。 真正在机器学习模型的选择和应用上的时间可能也就10%左右。当然, 这里是指应用, 如果是原创模型肯定不一样了。


但是花的时间少,不代表要求低, 只是要求能够熟练高效的应用。  这里给出部分模型对比的思考,抛砖引玉, 帮助大家熟练高效, 祝各位能在10%的时间显示出90%的实力。

常见学习模型对比和选择

有监督还是无监督Supervised VS Unsupervised

这个对比很明显, 但是目前强化学习(reinforcement learning)的横空出世, 或许有一天这些都不对了。


线性还是非线性Linear VS Non-Linear

如何把未知问题转化成已知问题, 如何把非线性转化成线性, 永远是很很需要的。


有没有先验With VS Without Prior

对于先验到底有没有决定性作用,贝叶斯派和非贝叶斯派还没有完全说服对方, 譬如深度学习的Hinton就说自己扬弃了先验(参考攒说 Geoff Hinton)。


是不是非参模型Parametric VS Non-Parametric

人都是很贱的, 很难统一的, 有些人要傻傻的不知道背后搞什么的编辑器(Word),有些人要可以控制一切的编辑器(Latex), 所以参不参看需求了, 或许跟视窗系统(Windows)横行一样,非专业人士更喜欢非参吧。


有没有集成学习Single VS Ensemble

引领一个10年的机器学习的突破,依然宝刀未老的集成学习,尤其对于表数据分析。


深浅学习 Shallow VS Deep

有个文章叫“THE NEURAL NETWORK ZOO” (http://www.asimovinstitute.org/neural-network-zoo/?_utm_source=1-2-2), 去动物园看看,蚯蚓和蛇一样很重要, 但是蛇更吓人。


在不在线Online VS Offline

分工越来越细, 在线学习的发展, 离不开H. Brendan McMahan 博士(CMU毕业,Google工作, 户外运动达人)在这个领域的坚持。



大数据还是大计算Huge Quantity VS Heavy Computation

求各种大数据小计算, 小数据大计算的经典案例。


并行,分布和异步Parallel VS Distributed VS Asynchronous

学分布式的都发达了, 可惜我去学Service了, 哭的一塌糊涂。


如何选择一个学习模型?

在这些模型认识的基础上, 然后就要思考如何选择了,做好一个选择, 需要对数据有认识(Data), 但这还是不够的, 还需要对需求有把握(Quality of service, QoS), 但这也是不够的, 还需要对应用人员的知识有掌握(Knowledge)。


如果所有问题都能很清晰的回答, 再回到前面模型的对比中进行选择, 或许会有所收获。

当然这里所有的说法, 都是技术出发, 但是我们知道好的业务数据分析是要从业务本身需求出发, 别忘记了服务于业务本身!

小结, 这里抛开数据预处理, 给定了模型选择的思考引子。

最后, 依然感谢, 我的师姐, 启明星辰副总裁张颖, 给予的美丽的封面图片!


相关文章

  • 机器学习模型常见对比

    ​在“R语言和表数据分析”, 我们对常见的数据预处理流程给出一个大致的解决方案, 在这个基础上, 才能很好的谈数据...

  • 机器学习-逻辑回归推导

    逻辑回归在机器学习中属于比较常见的模型,它由感知机模型发展而来。刚学习机器学习的时候,看到感知机这个名字好奇怪,为...

  • Linear/Logistic/Softmax Regressi

    Linear/Logistic/Softmax Regression是常见的机器学习模型,且都是广义线性模型的一种...

  • 机器学习常见模型总结

    最近邻 适用于小型数据集,是很好的基准模型,很容易解释。参考:监督学习与k近邻算法 线性模型 非常可靠的首选算法,...

  • 常见的机器学习模型

    0. 写在前面的话 本文中的内容节选自周志华的《Ensemble Methods: Foundations and...

  • 一文深度解读模型评估方法

    本文将总结机器学习最常见的模型评估指标。训练学习好的模型,通过客观地评估模型性能,才能更好实际运用决策。模型评估主...

  • ID3、C4.5、CART决策树生成算法总结

    简介 决策树模型是最常见的机器学习方法之一,也是入门机器学习必须掌握的知识。决策树模型呈现树形结构,在分类问题中,...

  • 算法工程师面试

    1、编程语言 2、基本算法 3、传统的机器学习算法 4、常见机器学习问题 过拟合问题、交叉验证问题、模型融合、...

  • sigmoid function为什么是1/{1+exp(-z)

    逻辑回归模型背景 逻辑回归模型是机器学习中最常见的一种基础模型,模型为:f_w,b(x)=\sigma(\sum_...

  • 机器学习模型迭代方法(总结)

    模型迭代方法 机器学习模型在实际应用的场景,通常要根据新增的数据下进行模型的迭代,常见的模型迭代方法有以下几种: ...

网友评论

      本文标题:机器学习模型常见对比

      本文链接:https://www.haomeiwen.com/subject/gcetmxtx.html