美文网首页
如何选择合适的机器学习算法

如何选择合适的机器学习算法

作者: piggy417 | 来源:发表于2017-05-29 09:08 被阅读0次

影响因素


数据的大小、质量及性质

可用计算时间

任务的急迫性

数据的使用用途

机器学习算法速查表(精确性、训练时间和易用性)(熟悉度)

监督学习

监督学习算法基于一组样本对作出预测。例如,以往销售业绩可以用来预测未来的价格走势。借助监督学习,我们会有一组由标注训练数据组成的输入变量和一组希望预测的输出变量。我们可以使用算法分析训练数据来学习一个将输入映射到输出的函数。算法推断的函数可通过概括训练数据预测未知情景中的结果进而预测未知的新实例。

分类:当数据被用于预测类别时,监督学习也可处理这类分类任务。给一张图片贴上猫或狗的标签就是这种情况。当分类标签只有两个时,这就是二元分类;超过两个则是多元分类。

回归:当预测为连续数值型时,这就是一个回归问题。

预测:这是一个基于过去和现在的数据预测未来的过程,其最大应用是趋势分析。一个典型实例是根据今年和前年的销售业绩以预测下一年的销售业绩。

半监督学习

监督学习的主要挑战是标注数据价格昂贵且非常耗时。如果标签有限,你可以使用非标注数据来提高监督学习。由于在这一情况中机器并非完全有监督,所以称之为半监督。通过半监督学习,你可以使用只包含少量标注数据的非标注实例提升学习精确度。

无监督学习

在无监督学习之中,机器完全采用非标注数据,其被要求发现隐藏在数据之下的内在模式,比如聚类结构、低维流形或者稀疏树和图。

聚类:把一组数据实例归为一类,从而一个类(一个集群)之中的实例与其他类之中的实例更相似(根据一些指标),其经常被用于把整个数据集分割为若干个类。这种分析可在每一分类之中进行,从而帮助用户需要内在模式。

降维:减少考虑的变量数量。在很多应用中,原始数据有非常高的特征维度,并且一些特征是多余的且与任务不相关。降维将有助于发现真实、潜在的关系。

强化学习

基于来自环境的反馈,强化学习分析和优化智能体的行为。机器尝试不同的策略,从而发现哪种行为能产生最大的回报,因此智能体不是被告知应该采取哪种行为。试错和延迟的 reward 是将强化学习与其他技术区分的特点。

mp.weixin.qq.com/s/E9E6chw7vTnQcdwRImMV9g

相关文章

  • 如何选择合适的机器学习算法

    影响因素 数据的大小、质量及性质 可用计算时间 任务的急迫性 数据的使用用途 机器学习算法速查表(精确性、训练时间...

  • 如何选择机器学习算法

    如何选择机器学习算法 如何针对某个分类问题决定使用何种机器学习算法? 当然,如果你真心在乎准确率,最好的途径就是测...

  • 为你的回归问题选择最佳的机器学习算法

    摘要:机器学习领域算法那么多?到底如何用?本文作者通过比较不同机器学习算法性能的优劣来为回归问题寻找最佳的算法选择...

  • keras与tensorflow好文收集

    服务器 如何自己打造一个深度学习服务器 算法 算法太多挑花眼?此文教你如何选择正确的机器学习算法 keras 如何...

  • 关于机器学习,你需要知道的三件事!

    摘要:MATLAB开发运营团队深度解析何为机器学习,什么时候使用机器学习,如何选择机器学习算法,MATLAB到底能...

  • dataframe缺失值(NaN)处理

        在进行机器学习的特征工程时,常常需要根据选择的机器学习算法,采用合适的数据预处理方式,特别是对于对于空值(...

  • 最流行的4个机器学习数据集

    机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度...

  • [转]机器学习工具汇总

    原作者:Jason Brownlee 工具是机器学习的重要组成部分,选择合适的工具与使用最好的算法同等重要。 在这...

  • 如何选择机器学习算法?

  • 机器学习算法选用指南

    在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题。虽然有很多有关机器学习算法的文章详细介绍了相关...

网友评论

      本文标题:如何选择合适的机器学习算法

      本文链接:https://www.haomeiwen.com/subject/yjdkfxtx.html