1 总体的-因子模型
1.1 模型设定
,,固定,则因子模型的设定为
其中为维随机向量,称为共同因子(common factor),为的线性变换,称为因子载荷(factor loading)。
一般会做出这些假设:,(其中为对角矩阵),。
有的文献中会假设,为对角矩阵,在这里我们假设它是球形的。在我们的假设下,我们有
我们可以看和的各元素的接近程度,定义的对角线元素为第个communality(共同性),它满足,而对于的非对角线元素有。
如果用一个正交矩阵,做,,那么我们依然有
它也是的一个-因子模型,也同样满足上文的那些假设,这说明因子模型不是唯一的。并且,如果没有额外的信息,我们想只利用就求解出因子和载荷是不可能的,下面的例子就说明了这个问题。
1.2 案例
假设有维随机向量,,假设单因子模型为
这里为标量。
根据上文的推导,我们可以得出一些结论。如的非对角线元素就是的非对角线元素,即,而的对角线元素必定小于的对角线元素,即,。
但是,我们无法得出具体的,比如我们可以取,也可以取,这些都是可行的。也就是说,在没有额外信息或使用某些准则时,我们无法只利用解出。
2 一些选择的准则
在中,我们给出了一个案例,说明想要选择的解,必须要借助一些准则。这里介绍两种准则。
2.1 最小化准则
我们可以选择使更小的。由于是对角矩阵,可以直接用它的迹来表示大小。
,,因此,可以选择。
2.2 Varimax准则
Kaiser(1958)提出了另一个准则varimax criterion:记为矩阵的第行、列元素,他们定义
式子看起来很复杂,但我们可以理解成,先将的所有元素做平方,然后计算某一列上的元素的方差,最后再对所有列加总。
对的案例进行计算,可以得到,,如果我们需要VC越大越好的载荷矩阵,就选择。尽管在这里两种方法选出的矩阵是一样的,但它们不等价。
Varimax criterion的另一个用途是,寻找旋转后的载荷,即它要寻找一个正交矩阵,使得
3 样本的-因子模型
将个样本排成的矩阵,并将对应的每个排成矩阵,将对应的每个排成矩阵,我们可以得到
还是和总体情况下一样,这些变量满足,,这里为对角矩阵,。样本的协方差矩阵可写为
参考文献
- Kaiser, H. F. (1958). The varimax criterion for analytic rotation in factor analysis. Psychometrika 23, 187–200.
网友评论