数据的标准化:
将数据按比例缩放,使之落入一个小的特定区间,一般目的在于:去除数据的单位限制,转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。数据的归一化便是一个典型的案例.
数据的归一化:
把数转换为(0,1)之间的小数
把有量纲的表达式转换为无量纲的表达式
归一化的好处:在多指标评价体系中,由于个评价指标的性质,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱值水平低指标的作用,因此,为了保证结果的可靠性,需要对原始数据进行标准化处理。
经验上来说,归一化就是让不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性。
数据标准化
1.Min-Max标准化

2.Z-Score标准化

3.小数定标(Decimal scaling)标准化(生信中好像不常用)

4.均值归一法(Mean normalization)
下图的 u是表示均值,value表示在一组数据中第i个元素的值

5.向量归一化

6.指数转换
指数转换是指:通过对原始数据进行相应的指数函数变换来进行数据的标准化。常见的指数转换函数方法如下所示:
lg函数:
计算公式:


转自:
https://blog.csdn.net/weixin_42792088/article/details/103971
网友评论