美文网首页
机器学习算法参数指标体系

机器学习算法参数指标体系

作者: 披着木头的石头 | 来源:发表于2019-11-29 15:09 被阅读0次

如何在自然中衡量事物的好坏?
人类从一无所有到如今主宰地球依靠的正是不断的寻求最优解,更是在极少数洞察宇宙规律的天才带领下总结出了客观规律并加以运用。
人类有了尺规才能衡量事物的长短,所以尺是一项天才的发明,它解决了按照一个纬度去衡量比较其他物体的问题。有了量化的标尺所以人才能批量制造工具,才不会担心与其他人的协作是否会功亏一篑,才使得更大范围的人类合作成为可能。举一反三,从一个纬度扩展到其他纬度便是扩展了知识版图,重构了人类社会的基础。


机器学习的整个体系应该如何评价呢?
怎么样的标准能够客观比较算法呢?
可以通过统计学检验来对比比较机器学习算法性能。


算法评估标准

回归问题

  • mae
  • mse
  • amse

分类问题

  • 准确度score
  • 混淆矩阵
  • 精准率
  • 召回率
  • roc曲线
  • pr曲线

混淆矩阵

1499410-20190816101253312-770308361.png

混淆矩阵的行数和列数一般是由分类算法的分类结果数目决定的,对于n各分类结果,混淆矩阵是nxn的矩阵,行和列的索引就是n个分类结果,其中行代表真实值,而列代表的是预测值。矩阵Axy每个网格里的值代表了真实值在x的情况下预测为y的数据样本个数。根据混淆矩阵得到的矩阵结果,我们可以再次定义两个评价指标,称为精准率precision和召回率recall,其中精准率precision=预测正确个数/预测总数,召回率recall=预测正确个数/真实所有个数。


1499410-20190816101213743-894383142.png

精准率和召回率的算法评判指标的解读应该结合具体分析问题的方向和实际场景,不同的场景对于不同指标的侧重点是不一样的。比如在股票预测里面我们更加注重精准率,我们更加注重预测结果的准确度,而召回率低一点意味着我们漏掉了一些希望的结果,而这个影响不大;而在疾病预测里面召回率则更加重要,因为我们更加希望把确实患有疾病的人群检查出来,不想漏掉实际患病的人群,而此时预测的准确率低一点也没有关系。


1499410-20190816101103456-1810866442.png
也有一些情况并不是只关注精准率和召回率中的一个,而是需要同时兼顾精准率和召回率,这个指标有一个叫做F1score,它的指两者的调和平均值,而非简单的求取平均。它的特点是如果精准率和召回率一个特别大,一个特别小,则输出的F1 score则比较小,它可以防止正常平均时的一些判断偏差的情况,比较好的兼顾两者的共同大小。
1499410-20190816102313048-890517947.jpg

精准率和召回率在机器学习算法的分类算法中是存在矛盾的,随着判断score判断阈值的提高,精准率会不断地增大,而召回率是不断减小的。

PR曲线,即precision-recall curve,它可以表示出机器学习分类算法的召回率随着精准率变化的曲线,通过对比可以看出不同算法的好坏,一般与x/y轴所围成的面积越大,其综合性能也就越好。


1499410-20190816102330275-749517501.jpg

ROC曲线,描述TPR和FPR之间的关系,是统计学上经常用到的曲线和指标曲线,其主要的指标是ROC曲线与x轴所围成的面积roc-au_score,面积越大,则模型越好。另外,ROC曲线对于具有极偏数据是不敏感的。


1499410-20190816102433679-182440983.jpg 1499410-20190816102504444-1472029189.jpg

额外参考资料 https://www.jianshu.com/p/715a1a5a4dbdhttps://www.cnblogs.com/asialee/p/9800039.html

相关文章

  • 机器学习算法参数指标体系

    如何在自然中衡量事物的好坏?人类从一无所有到如今主宰地球依靠的正是不断的寻求最优解,更是在极少数洞察宇宙规律的天才...

  • 超参数

    超参数:在我们运行机器学习算法之前,需要指定的参数。模型参数:算法过程中学习的参数。 kNN算法没有模型参数kNN...

  • 2019-06-27-4.5 超参数

    4.5 超参数 超参数就是指在运行机器学习算法之前,需要指定的参数。 模型参数:算法过程中学习的参数。 KNN算法...

  • 4.5 超参数

    4.5 超参数 超参数就是指在运行机器学习算法之前,需要指定的参数。 模型参数:算法过程中学习的参数。 KNN算法...

  • 机器学习笔记 第3课:参数算法和非参数算法

    什么是参数机器学习算法?它与非参数机器学习算法有何不同? “假设”通常会大大简化学习过程,但也会限制学到的东西。将...

  • 38、一种选择机器学习算法的数据驱动方法

    *如果您知道要使用哪种算法或算法配置,则 不需要使用机器学习* 没有最好的机器学习算法或算法参数。 我想要治愈你这...

  • 天天随手记,持续更新中(2018-05-02)

    超参数hyperparameters 超参数通过控制机器学习算法来调整模型以至于适应数据,controls how...

  • 深度学习知识点汇总-机器学习基础(1)

    2 机器学习基础 2.1 各种机器学习算法图示 图6是通过正则化来约束参数,从而得到较好的回归曲线。

  • 机器学习-梯度下降算法

      在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降算法(Gradient Descent Algori...

  • 机器学习4:局部加权回归

    参数学习算法,非参数学习算法 参数学习算法,用固定的明确的参数进行数据的拟合。比如线性回归。非参数学习算法,使用的...

网友评论

      本文标题:机器学习算法参数指标体系

      本文链接:https://www.haomeiwen.com/subject/ooawwctx.html