美文网首页
多个特征针对一个标签列的相关系数计算

多个特征针对一个标签列的相关系数计算

作者: 麒麟央宗 | 来源:发表于2019-07-18 17:03 被阅读0次

    思路:

    step 0: 特征提取,特征归一化

    step 1.先将多个特征项进行回归分析,建立回归模型。

    step 2.利用回归模型,计算预测值

    step 3.计算预测值和标签值之间的相关系数

    step 0:

    特征归一化选择:MinMax,0均值 etc.

    sklearn 下自带MinMaxScaler对象, StandardScaler对象

    step 1:

    回归模型选择:线性回归,随机森林?

    附加:做出视觉效果图

    step 2:

    没啥,直接predict就好

    step 3:

    相关系数类型:pearson,kendall, spearman

    pearson:线性,定距变量。得出r值为相关系数

    spearman:定序型变量,不等距变化的数据,阶级等。但是还是能排序的数据。算出的P值,并不是直接可用的相关系数,需要对照spearman轶相关系数表。

    kendall: 定类变量,需转化成数字。 能体现出一致性不一致性的对。得出值为相关系数。

    运用pandas或者numpy计算

    相关文章

      网友评论

          本文标题:多个特征针对一个标签列的相关系数计算

          本文链接:https://www.haomeiwen.com/subject/dxdllctx.html