机器学习输入的特征数据进行训练时需要进行标准化、归一化,使数据的分布符合正态分布模型(生活中多数数据都是此模型),或者与与参数相符合的模型分布,一般是把数据缩放到[0,1]或者[-1,1]之间,如果数据有缺失,还需要填补缺失的数据。详情请见:数据预处理最要使用的方法有几大类:
- 绝对值最大值法
(找出参数的最大值,然后使用参数集合中的数除以此最大值) - 最小最大值法
- 参数编码法
- 数据降维(PCA和SVD分解)
机器学习输入的特征数据进行训练时需要进行标准化、归一化,使数据的分布符合正态分布模型(生活中多数数据都是此模型),或者与与参数相符合的模型分布,一般是把数据缩放到[0,1]或者[-1,1]之间,如果数据有缺失,还需要填补缺失的数据。详情请见:数据预处理最要使用的方法有几大类:
本文标题:数据预处理
本文链接:https://www.haomeiwen.com/subject/xhupuxtx.html
网友评论