特征评估

作者: shudaxu | 来源:发表于2019-03-12 21:25 被阅读0次

1、(训练前)特征本身覆盖率
特征本身对样本的覆盖程度

2、(训练前)特征本身在目标上的区分度
连续值分label分布概率PDF(正样本上该特征值的PDF,负样本该值的PDF,其交叉区分程度)
离散值分label分布(类似连续值,也可以获得其正负样本上的PMF)
单特征AUC(连续值可以压缩值域来计算,离散值也可以用出现不出现0,1,p和非p,来转化为单特征值AUC)
PS:对于分布的区分度,可以通过KL散度来进行数值化评估

3、(训练阶段)判断特征对模型的贡献度
增减特征后的对比实验,计算两种方式训练模型后,模型在测试集的AUC

4、(预估阶段判)断特征对模型的贡献度
在预估的时候对某个slot的值赋予随机值,或者0,再来计算测试集AUC。与原基线AUC有较大跌幅,则重要性高,跌幅越低,则重要性越低。
PS:有时候用4方法,跟3方法,2方法得到的结果不相同。比如现有模型中已有一个跟待估特征有较强的线性相关性。则就算其对目标有较好的区分度,在3,方法中可能也体现出不增益。但是特征本身是有价值的

相关文章

  • 特征评估

    1、(训练前)特征本身覆盖率特征本身对样本的覆盖程度 2、(训练前)特征本身在目标上的区分度连续值分label分布...

  • 特征选择__包裹型

    包裹型--递归特征删除算法 把特征选择看做一个特征子集搜索问题,筛选各种特征子集,用模型评估效果。 典型的包裹型算...

  • 教学评估与测验——伍尔福克教育心理学第15章读书笔记

    一、教学评估的基本含义 1、区分测量与评估。测量是量化的——用数字描述一个事件或特征;评估虽包含测量...

  • 教学评估的基本含义--《伍尔福克教育心理学》读书笔记(十六)

    1、区分测量与评估。 测量是指用数字描述个事件或特征; 评估虽包括测量,但比测量范围更宽广,因为评估包含各种取样...

  • sklearn库-特征工程

    sklearn作为python机器学习的一个常用库,可以用来做特征工程,算法的调用,模型的评估 特征工程 特征工程...

  • 2021-03-23 特征选择的效果评估

    在初步特征筛选之后,若使用树模型,特征经过数值化处理后就可以模型进行效果评估,一般会给出一个AUC或KS的模型评估...

  • 特征选择的方法

    Filter Filter这类方法是选定一个指标来评估特征,根据指标值来对特征排序,去掉达不到足够分数的特征。这类...

  • 决策树

    算法思想 从数据集中找到一个特征,这个特征在划分数据分类中起决定性作用.为了找到这个特征,就要评估每个特征,找到区...

  • 【百面机器学习-模型评估】

    为什么需要模型评估? 在计算机科学特征时机器学习领域中,对模型的评估至关重要。只有选择与问题相匹配的评估方法...

  • 伍尔福克教育心理学——教学评估与测验

    第一节 教学评估的基本含义 测量与评估 测量是指用数字描述一个事件或特征;评估虽包括测量,但比测量范围更宽广,...

网友评论

    本文标题:特征评估

    本文链接:https://www.haomeiwen.com/subject/amuopqtx.html