美文网首页
机器学习笔记5-PCA

机器学习笔记5-PCA

作者: 江湾青年 | 来源:发表于2021-07-06 21:59 被阅读0次

    PCA简介

    相关背景

    在许多领域的研究与应用中,往往需要对供应的多个变量进行大量的采集,收集大量数据以便进行分析但寻找规律。多变量大样本会为研究和应用提供大量的信息,也提供了大量的信息。在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来了不便。一个进行分析,分析往往是孤立的指标,而不是综合的。 发布会事件会损失很多信息,容易产生错误的结论。
    因此需要找到一个合理的方法,在减少需要分析的方法的同时,尽量减少原因收集信息的损失,以达到对所收集的数据进行全面分析的目的。由于各变量间的相关关系,因此有可能用具体的综合指标分别代表综合存在于各个变量中的各种信息。主要成分分析(PCA)与因素分析就属于这类降维的方法。

    问题描述

    下表1是某些学生的语文、数学、物理、化学成绩统计: 表1 首先,如果这些成绩不相关,就可以看出来,数学、物理、化学三门课的成绩构成了主要部分。(很显然,数学作为第一主成分,因为数学成绩拉的最开)。为什么看能看出来?因为坐标轴选对了!下面再看一组学生的数学、物理、化学、数学、历史、英语成绩统计,见表2,很难看出来: 表2 数据太多了,导致可能会乱!因为,因为无法直接看出这组数据的主要部分,在坐标系下这组数据分布的很散乱。把这些数据在相应的中表现出来,如果你能自己换一个观察角度找出成分。如图1所示: 图1

    参考

    https://www.jianshu.com/p/ee9d21868b77

    相关文章

      网友评论

          本文标题:机器学习笔记5-PCA

          本文链接:https://www.haomeiwen.com/subject/brxnultx.html