防止模型过拟合的方法中就有降维。
1.为什么要对数据做降维处理?
1.维度过高容易产生维度灾难,维度过高容易使得数据的分布变得非常稀疏,这样分类起来更加困难。
形象理解如下:
2.维度过高容易产生计算的困难。
3.实际样本的特征中有大量冗余的特征,例如一个人的收入水平在某种程度上来说和他的工作年限呈现一定的正相关性,这样我们只需要利用两特征中的一种即可,这样可以方便计算。
有关PCA,LDA,后面详细说明。
------------------------------------------
网友评论