- 什么是数据标准化 ?
- 为什么要标准化 ?
- 标准化有什么好处 ?
1. 什么是数据标准化 ?
标准化后的变量 满足:
即具有和标准正态分布一样的 和
通过以上关系, 我们可以推出
是如何由原变量
变化而来的:
标准化是通过设置一个整体的性质,来影响到里面具体的每个元素
2. 为什么要标准化 ?
标准化也可以看做一种归一化, 所以它具有归一化的优点,即统一了量纲
拥有不同尺度的不同特征,在梯度下降中会有不同的表现:
用到梯度下降的算法(logit, SVM,perceptrons,neural networks等都需要做这样的处理)
当然同样的道理也适用于其它归一化方法
3. 标准化有什么好处
1. 不改变变量之间的相关系数
例如: Pearson 相关系数还是 Spearman 或 Kendall相关系数还是偏相关系数都不会改变
2. 不改变秩
4. 相关证明
经过标准化后的数据,Pearson 相关系数不会改变:
ref:
网友评论