@[toc]
4-4-1 主成分分析
-
在若干相互关联、关系复杂的一组变量
中,找到最为关键的因素。在寻找关键因素过程中,还需要找到能够反映该组变量这个群体的主要特征。
-
综合评价要求评价指标线性无关
-
建立回归模型的需要
思想原理
原始数据是一组n维列向量组,将其进行标准化处理:
希望得到的形式:
对各的要求是:
-
使各个综合指标
彼此独立或不相关
-
使各个综合指标
所反映的各个样品的总信息等于原来p个指标
所反映的各个样品的总信息,即
主成分的系数确定
4-4-2 主成分分析的应用
主成分分析计算步骤:
- 对原始资料矩阵进行标准化处理
- 计算相关稀疏矩阵R
- 计算R的特征值
和单位正交特征向量
- 确定主成分个数,一般累积方差贡献率要超过80%
- 建立相应的主成分方程:
后续拓展:综合评价和主成分回归
4-5-1 方差分析
使用背景:研究生产条件或试验条件的改变对产品的质量和产量有无影响。哪些因素是主要的,哪些是次要的。
方差分析:通过对试验数据进行分析,找出对该事物有显著影响的因素,个因素之间的交互作用,以及显著影响因素的最佳水平的有效方法。
因素:影响试验指标的条件
水平:因素所处的状态
单因素方差分析:试验过程中除因素A外,其他影响指标的因素都保持不变(只有随机因素存在)。任务是从试验结果推断,因素A对指标有无显著影响,即当A取不同水平时指标有无显著差别。
假设因素A有S个水平,在水平
下进行了
次独立实验,为建立数学模型,假设:
-
各个水平下的样本来自具有相同方差
,均值分别为
正态总体
-
不同水平下的样本相互独立
由于
,即有
,故
可看成随机误差,记
,则
其中
均为未知参数
方差分析的任务:
-
检验S个总体的均值是否相等,即检验假设
-
做出未知参数的估计
4-5-2 单因素方差分析
4-5-3 非参数检验
非参数检验 non-parametric test:又称为分布自由检验,一种与总体分布状况无关的检验方法,它依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。
-
非参数检验主要利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。
-
符号检验法
设X为连续总体,其中位数即为
,考虑假设检验问题
由于是总体的中位数,可知当原假设成立时,
,因此上述假设检验问题等价于:
从总体抽取容量为n的样本时,记为+号;当
时,记为-号;当
,记为0.用
分别表示+号和-号个数。令
取检验统计量
-
Wilcoxon符号秩检验
符合检验只考虑了分布在中位数两侧的样本数据的个数,并没有考虑中位数两侧数据分布的疏密程度的差别,这就使得符号检验的结果比较粗糙,检验功能低。
Wilcoxon检验比单独用正负号的检验更加有效,它适用于单个样本中位数的检验,也适用于配对样本的比较检验,但并不要求样本之差服从正态分布,只要求对称分布即可。
原理:
设连续分布总体X服从对称分布,其中位数记为
,考虑假设检验问题:
从总体X中抽取容量为n的样本,将
从小到大排序,并计算它们的秩即序号,取值相同求平均秩,根据
的序号将分为正
和负号组,用
分别表示正号组和负号组的秩和,则
若
成立,则
取值相差不大,即
不应太小,否则应认为
不成立。选取检验统计量
网友评论