美文网首页
多分类问题

多分类问题

作者: 程序猿爱打DOTA | 来源:发表于2017-05-26 14:52 被阅读0次

    “一对一”,OvO: 产生N(N-1)个分类器,测试时,新样本提供给所有分类器,取结果中预测最多的类别作为最终结果

    “一对多”,OvR:   产生N个分类器,在预测时,若只有一个分类器预测为正类,则对应的类别标记为最终分类结果。若有多个分类器预测为正例,则通常考虑各个分类器的预测置信度,选择置信度最大的类别标记作为分类结果。


    "多对多',MvM: 每次将若干类作正例,剩余的作负例,不能随便划分,最常用的技术“ECOC” 纠错输出码;

    OvO和OvR都是MvM的特例

    编码:对N 个类别做M次划分,每次划分将一部分类别划为正例,一部分划为反例,训练M个分类器

    解码:M个分类器分别对测试样本进行预测,这些预测标记组成一个编码,将这个预测编码与每个类别各自的编码进行比较,返回其中距离最小的类别作为最终预测结果。 

    详见西瓜书P65

    编码矩阵: 二元码:正类,反类; 三元码:正类,反类,停用类

    ECOC编码对分类器的错误有一定的容忍和修正能力,ECOC越长,纠错能力越强。


    如果希望为一个样本同时预测出多个类别标记,这个任务就不再是多分类学习,而是“多标记学习”,这是机器学习领域,近年来相当活跃的一个研究领域。

    相关文章

      网友评论

          本文标题:多分类问题

          本文链接:https://www.haomeiwen.com/subject/sdcxfxtx.html