分类任务的性能度量

作者: 心水 | 来源:发表于2019-01-26 14:24 被阅读14次

为了评估机器学习算法的能力，我们必须设计其性能的定量度量。对于诸如分类和转录任务，我们通常度量模型的准确率。准确率是指该模型输出正确结果的样本比率。我们也可以通过错误率得到相同的信息。错误率是指该模型输出错误结果的样本比率。我们通常把错误率称为0-1损失的期望。在一个特定的样本上，如果结果是对的，那么0-1损失是0; 否则是1。

通常，我们会更加关注机器学习算法在未观测数据上的性能如何，因为这将决定其在实际应用中的性能。因此，我们使用测试集数据来评估系统性能。

蛋哥最近拿到一个客户最近半年的所有派单数据，派单是指给一个运输订单指定一个运输供应商，通过简单的数据分析，抽象出了2000条左右的派单规则，但是目前系统支持2000条规则的时候有些性能问题。解决这个问题的一种方法是解决性能问题，另一种方法就是机器学习了，是一种分类任务的机器学习，第一感觉是用决策树相关的机器学习算法比较合适。

可以把半年的历史数据分为两份，一份是5个月的数据，作为训练数据集，一份是一个月的数据作为测试数据集，用5个月的数据训练出一个正确率在90%以上的模型，然后验证这个模型在测试集上的表现是否也能到90%以上。

这个模型上线以后，因为还有10%的错误率，需要运输供应商使用系统中的接单/拒单功能，对于正确的派单接单，对于错误的派单拒单，根据这个数据，可以度量这个模型在产品环境的准确率是否可以达到用户的预期。

网友评论

本文标题：分类任务的性能度量

本文链接：https://www.haomeiwen.com/subject/hnjijqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

分类任务的性能度量

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读