美文网首页
数据转换处理之规格化:十基数变换规格化算法

数据转换处理之规格化:十基数变换规格化算法

作者: 南极有条沙丁鱼 | 来源:发表于2017-07-22 23:25 被阅读110次

    规格化就是将一个属性取值范围投射到一个特定范围之内,以消除数值型属 性因大小不一而造成挖掘结果的偏差。规划化处理常常用于神经网络、基于距离 计算的最近邻分类和聚类挖掘的数据预处理。对于神经网络,采用规格化后的数 据不仅有助于确保学习结果的正确性,而且也会帮助提高学习的速度。对于基于 距离计算的挖掘,规格化方法可以帮助消除因属性取值范围不同而影响挖掘结果 的公正性。介绍三种规格化方法

    • <a href="http://www.jianshu.com/p/f59c051551e1">最大最小规格化方法</a>
    • <a href="http://www.jianshu.com/p/92318a6c3a65">零均值规格化方法</a>
    • <a href="http://www.jianshu.com/p/890c36ff8f34">十基数变换规格化方法</a>

    十基数变换规格化方法

    • 该方法通过移动属性 值的小数位置来达到规格化的目的。
      <b>所移动的小数位数取决于属性绝对值的最大值</b>。属性的值可以通过以下计算公式获得其映射值v':
    十基数变换规格化算法.png
    • 示例
      假设属性A的取值范围是从 -986 到 917。属性A绝对值的最大值
      为986。采用十基数变换规格化方法,就是将属性A的每个值除以 1000(即j = 3 ) 即可,因此-986 映射为 -0.986。

    • 代码实现
      待续......

    相关文章

      网友评论

          本文标题:数据转换处理之规格化:十基数变换规格化算法

          本文链接:https://www.haomeiwen.com/subject/etrpkxtx.html