美文网首页
数学建模系列笔记5:综合评价和因子分析

数学建模系列笔记5:综合评价和因子分析

作者: Cache_wood | 来源:发表于2022-02-25 15:39 被阅读0次

    @[toc]

    5-1-1 模糊综合评价

    模糊综合评价法使用背景

    • 对评价对象进行等级划分
    • 评价指标中有人为赋值的变量
    • 评价指标之间不相关
    • 设与被评价对象相关的因素有n个,记作:

      U = \{u_1,u_2,…,u_n\}称之为因素集

    • 又设所有可能出现的评语有m个,记作:

      V = \{v_1,v_2,…,v_m\}称之为评语集

    • 由于各种因素所处地位不同,作用也不一样,考虑用权重A = \{a_1,a_2,…,a_n\}来衡量。

    模糊综合评价法解题步骤

    1. 确定因素集

    2. 确定评语集

    3. 进行单因素评判得到r_i = (r_{i1},r_{i2},…,r_{im})

    4. 构造综合评价矩阵
      R = \begin{pmatrix} r_{11} &r_{12} &…& r_{1m} \\ r_{21}&r_{22} &…& r_{2m}\\ …&…&\quad &…&\\ r_{n1}&r_{n2} &…& r_{nm} \end{pmatrix} \\

    5. 综合评判,对于权重A = (a_1,a_2,…,a_n)计算B = AR = (b_1,b_2,…,b_m),并根据隶属度最大原则做出评判。

    总结与体会

    模糊综合评价法的优点:

    1. 原理和计算方法较简单;
    2. 可以将不完全信息、不确定信息转化为模糊概念,将定性问题定量化,以提高评估的准确性,可信性。

    模糊综合评价法的缺点:

    1. 当指标数较多时,不一定能有效解决指标间信息重叠的问题;
    2. 权重确定有较强的主观性;
    3. 容易使评价结果不全面。

    5-1-2 恋爱对象的模糊综合评价

    定义:设U是论域,称映射
    \mu_A:U\rightarrow [0,1]\\ x \rightarrow \mu_A \in [0,1]
    确定了一个U上的模糊子集A。映射\mu_A称为A隶属函数,\mu_A(x)称为x对A的隶属程度,简称隶属度。

    模糊集合A由隶属函数\mu_A唯一确定,故认为二者是等同的。
    Zadeh表示法\\ A = \frac{A(x_i)}{x_i}+\frac{A(x_2)}{x_2}+…+\frac{A(x_n)}{x_n}
    这里\frac{A(x_i)}{x_i}表示x_i对模糊集A的隶属程度是A(x_i).

    模糊集并不再回答“是或不是”的问题,而是对每个对象给一个隶属度,所以与经典集合有本质区别。

    模糊集的运算

    设A,B是论域U的两个模糊集合,定义:
    包含:A\subseteq B\Leftrightarrow A(x)\leq B(x),\forall x\in U\\ 相等:A = B \Leftrightarrow A(x) = B(x),\forall x \in U\\ 并:(A\cup B)(x) = A(x) \vee B(x),\forall x\in U(\vee表示取大)\\ 交:(A\cap B)(x) = A(x) \wedge B(x),\forall x \in U(\wedge表示取小)\\ 余:A^c(x) = 1-A(x),\forall x\in U
    模糊矩阵

    R = (r_{ij})_{m\times n},0\leq r_{ij}\leq 1,称R为模糊矩阵。

    r_{ij}只取0或1时,称R为布尔(Boole)矩阵。当模糊方阵R = (r_{ij})_{m\times n}的对角线上的元素r_{ij}都为1时,称R为模糊自反矩阵

    模糊矩阵的运算

    A = (a_{ij})_{m\times n},B = (b_{ij})_{m\times n}都是模糊矩阵,定义
    相等:A = B\Leftrightarrow a_{ij} = b_{ij}\\ 包含:A\leq B \Leftrightarrow a_{ij} \leq b_{ij}\\ 并:A \cup B = (a_{ij}\vee b_{ij})_{m\times n}\\ 交:A\cap B = (a_{ij}\wedge b_{ij})_{m\times n}\\ 余:A^c = (1-a_{ij})_{m\times n}
    模糊矩阵的合成

    A = (a_{ij})_{m\times s}, B = (b_{ij})_{s\times n},称模糊矩阵
    A \circ B = (c_{ij})_{m\times n}
    为A与B的合成,其中c_{ij} = max\{(a_{ik}\wedge b_{kj})|1\leq k \leq s\}

    5-2 层次分析法

    层次分析法 Analytic Gierarchy Process, AHP:对一些较为复杂、较为模糊的问题做出决策的简易方法,特别适用于那些难于完全定量分析的问题,是一种简便、灵活而又实用的多准则决策方法。

    层次分析法步骤:目标层O、准则层C、方案层P,每层有若干元素,各层元素间的关系用相连的直线表示。通过相互比较确定各准则对目标的权重,及各方案对每一准则的权重。

    将上述两组权重进行综合,确定各方案对目标的权重。

    成对比较阵和权向量

    元素之间两两对比,对比采用相对尺度。设要比较各准则C1,C2,…,Cn对目标O的重要性
    C_i:C_j\Rightarrow a_{ij}\\ A = (a_{ij})_{n\times n}>0,a_{ji} = \frac{1}{a_{ij}}
    正互反矩阵

    矩阵A = (a_{ij})_{m\times n}为正互反矩阵,若当矩阵A满足以下特征:
    $$1. a_{i,j}\geq 0\

    1. a_{i,j} = 1,i=j\
    2. a_{i,j}= \frac{1}{a_{j,i}},i\ne j
      $$

    权向量

    考察完全一致的情况

    w = (w_1,w_2,…,w_n)^T \sim权向量
    A =\begin{pmatrix} \frac{w_1}{w_1}&\frac{w_1}{w_2}&…&\frac{w_1}{w_n}\\ \frac{w_2}{w_1}&\frac{w_2}{w_2}&…&\frac{w_2}{w_n}\\ …&…&… &…&\\ \frac{w_n}{w_1}&\frac{w_n}{w_2}&…&\frac{w_n}{w_n} \end{pmatrix} \\
    权向量的选取

    • A的秩为1,A的唯一非零特征根为n
    • A的任一列向量是对应于n的特征向量
    • A的归一化特征向量可作为权向量

    5-3 Topsis法

    Topis全名为逼近于理想解的排序算法(Technique for Order Preference by Similarity to Ideal Solution),是一种适合多指标、多方案决策分析的系统评价方法。通过构造“正理想解”与“负理想解”来对多个决策方案进行排序。

    “正理想解”:设想的最好解,它的各个属性值都达到各候选方案中的最好的值。

    “负理想解”:设想的最坏解,它的各个属性值都达到各候选方案中的最坏的值。

    Topsis法通过计算某一距离与正理想解与负理想解之间的加权欧氏距离,得出该方案与正理想解的接近程度,以此作为评价各方案优劣的依据。

    1. 形成决策矩阵

      设参与评价的对象集为M = (M_1,M_2,…,M_m),指标集为D = (D_1,D_2,…,D_n),方案M_i对指标D_j的值记为x_{ij}(i=1,2,…,m;j=1,2,…,n),则形成的决策矩阵X为
      X = \begin{pmatrix} \quad &D_1&D_2 &…& D_n \\ M_1&x_{11}&x_{12} &…& x_{1n}\\ M_2&x_{21} &x_{22} &…& x_{2n}\\ …&…&…&… &…&\\ M_m&x_{m1}&x_{m2}&…& x_{mn} \end{pmatrix} \\

    2. 无量纲化决策矩阵

      为消除各指标量纲不同对方案决策带来的影响,需要对决策矩阵进行无量纲化处理,构建标准化矩阵V = (v_{ij})_{m\times n}.

      对于越大越优型指标:归一化后的值为
      v_{ij} = \frac{x_{ij}- min\{x_{1j},x_{2j},…,x_{nj}\}}{max\{x_{1j},x_{2j},…,x_{nj}\}-min\{x_{1j},x_{2j},…,x_{nj}\}}
      对于越小越优型指标:归一化后的值为
      v_{ij} = \frac{max\{x_{1j},x_{2j},…,x_{nj}\}-x_{ij}}{max\{x_{1j},x_{2j},…,x_{nj}\}-min\{x_{1j},x_{2j},…,x_{nj}\}}

    3. 构建加权决策矩阵

      将各指标权重与无量纲化矩阵相乘,得到加权决策矩阵R = (r_{ij})_{m\times n}
      r_{ij} =w_j ·v_{ij} (i=1,2,…,m;j=1,2,…,n)
      w_j是各指标的权重值,权重的计算可以采用层次分析法、模糊综合评价法、熵权法、均方差法等方法

    4. 计算正理想解与负理想解
      S_j^+ = \left\{ \begin{array}{rcl} max_{1\leq i\leq m}\{r_{ij}\},j=1,2,…,n; D_j为越大越优型指标\\ min_{1\leq i\leq m}\{r_{ij}\},j=1,2,…,n; D_j为越小越优型指标\\ \end{array} \right.\\ S_j^- = \left\{ \begin{array}{rcl} min_{1\leq i\leq m}\{r_{ij}\},j=1,2,…,n; D_j为越大越优型指标\\ max_{1\leq i\leq m}\{r_{ij}\},j=1,2,…,n; D_j为越小越优型指标\\ \end{array} \right.

    5. 计算各方案与正理想解和负理想解间的距离

      采用欧式距离
      Sd_i ^+ = \sqrt{\sum_{j=1}^n (S_j^+ - r_{ij})^2},i=1,2,…,m\\ Sd_i ^- = \sqrt{\sum_{j=1}^n (S_j^- - r_{ij})^2},i=1,2,…,m\\

    6. 计算各方案与正理想解的相对贴近度

      各方案与正理想解的相对贴近度\eta_i = \frac{Sd_i^-}{Sd_i ^+ + Sd_i ^-},i = 1,2,…,m

      \eta_i越大,决策方案越接近正理想解,越优。

    7. 方案优劣排序

    5-4 主成分综合评价

    方法背景:

    设置较多指标,带来问题:

    • 掩盖问题本身的规律性
    • 为数据处理设置障碍

    主成分分析:精简变量、保留原始信息

    目标:构造一些综合指标使满足如下条件:

    1. 指标个数尽可能少;
    2. 指标间相互独立;
    3. 尽可能多地包含原始指标所含的关于总体的信息

    方法步骤

    1-4. 主成分理论分析

    1. 建立相应的主成分方程 Z = U^TX

    2. 构造评价函数,计算综合得分
      F= \alpha_1Z_1 +\alpha_2 Z_2 + … +\alpha_k Z_k

    5-5-1 因子分析的思想原理

    起源一:寻找潜在变量

    因子分析模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

    起源二:综合评价

    • 综合评价要求评价指标线性无关,而实际上很多现象难以达到这个要求。而且宏观总体上不仅需要评价,潜在变量也需要评价。
    • 对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。评价就用这些公共因子。

    因子分析
    X = AF+\varepsilon
    F_1,F_2,…,F_m为公共因子,是不可观测的变量,A = (a_{ij})_{p\times m}称为因子载荷阵,a_{ij}表示第i个变量在第j个因子上的载荷loading,\varepsilon_i是特殊因子,是不能被前m个公共因子包含的部分。并且满足cov(F,\varepsilon) = 0,F,\varepsilon不相关。

    公因子需要满足以下要求:

    1. cov(F_i,F_j) = 0
    2. E(F_i) = 0,D(F_i) =1
    3. V_j = \sum_{k=1}^p a_{kj}^2,V_1\geq V_2\geq …\geq V_m,\sum_{j=1}^m V_j \approx p

    D(AF) = AD(F)A' = AA' = AA'\\ P^{-1}RP = P'RP =\Lambda = \\ R = P\sqrt{\Lambda}(\sqrt{\Lambda})’P' = P\sqrt{\Lambda}(P\sqrt{\Lambda})’ = AA'\\ 因此 A = P\sqrt{\Lambda}

    一旦求出A,因子分析将可以处理以下问题:

    1. 得到重要的公因子以及得分
    2. 进一步进行聚类分析、判别分析、回归分析等
    3. 可以运用因子得分进行综合评价,包括整体评价和单项评价

    5-5-2 因子分析的应用

    方差极大旋转

    • 所谓正交旋转,是在保持各因子轴相互垂直的关系不变的前提下,对因子轴所做的一种旋转变换,也叫正交变换。

    • 假设各因子轴经过正交旋转后,各F_j变换为f_j(j=1,2,…,m),各指标的因子坐标由a_{kj}变为d_{kj}.
      \sum_{j=1}^m a_{kj}^2 = \sum_{j=1}^m d_{kj}^2 = h_k^2.但\sum_{k=1}^m a_{kj}^2 \ne \sum_{k=1}^m d_{kj}^2

    • 如果记各个x_kf_j上的因子载荷d_{kj}的平方d_{kj}^2的方差为S_j^2,则希望S_j^2越大越好。

    • 正交变换就是在保证h_k^2不变、f_j正交性不变(相互垂直、期望为0,方差为1)的前提下,尽可能让f_j的所有因子载荷d_{kj}^2(k=1,2,…,p)达到最大。

    • 正交变换是公因子轴两两变换逐步得到。

    因子分析计算步骤

    1. 对原始资料矩阵进行标准化处理

    2. 计算相关系数矩阵R

    3. 计算R的特征值\lambda和单位正交特征向量P
      P'RP = diag(\lambda_1,\lambda_2,…,\lambda_p)

    4. 确定公因子个数

    5. 建立因子方程

    6. 如果发现某一个F_j在各个x_k的表达式中,因子载荷的差异不大,就需要做正交变换

    7. 得出因子得分公式,并计算公因子得分

    5-6-1 灰色关联分析

    判别分析方法使用背景

    灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,即“灰色关联度“,作为衡量因素之间关联程度的一种方法。

    灰色关联分析基本步骤:

    1. 确定参考数列

      确定参考数列(评价标准)后,我们再找到比较对象(评价对象)进行关联分析计算。

      设评价对象有m个,评价指标有n个。

      参考数列为x_j = (x_j(1),x_j(2),…,x_j(k),…,x_j(n))

      比较数列为x_i = (x_i(1),x_i(2),…,x_i(k),…,x_i(n)),i=1,2,…,m

    2. 原始数据标准化处理:初值化、均值化、标准化、逆化、倒数化

    3. 关联系数公式

    4. 关联度的计算与比较

    总结与体会

    灰色关联分析方法对样本量的多少没有过分的要求,也不需要典型的分布规律,计算量少到甚至可以手算,且不致出现关联度的量化结果与定性分析不一致的情况。

    5-6-2 灰色关联分析应用

    5-7 熵值法

    利用熵的概念确定指标权重的方法称为熵值法The Entropy method。其出发点是根据某同一指标观测值之间的差异程度来反映其重要程度,如果各被评价对象的某项指标的数据差异不大,则反映该指标对评价系统所起的作用不大,差异程度越大,该指标对综合评价的影响越大。

    熵值法模型

    1. 形成决策矩阵

      设参与评价的对象集为M = (M_1,M_2,…,M_m),指标集为D = (D_1,D_2,…,D_n),方案M_i对指标D_j的值记为x_{ij}(i=1,2,…,m;j=1,2,…,n),则形成的决策矩阵X为
      X = \begin{pmatrix} \quad &D_1&D_2 &…& D_n \\ M_1&x_{11}&x_{12} &…& x_{1n}\\ M_2&x_{21} &x_{22} &…& x_{2n}\\ …&…&…&… &…&\\ M_m&x_{m1}&x_{m2}&…& x_{mn} \end{pmatrix} \\

    2. 无量纲化决策矩阵

      为消除各指标量纲不同对方案决策带来的影响,需要对决策矩阵进行无量纲化处理,构建标准化矩阵V = (v_{ij})_{m\times n}.

      对于越大越优型指标:归一化后的值为
      v_{ij} = \frac{x_{ij}- min\{x_{1j},x_{2j},…,x_{nj}\}}{max\{x_{1j},x_{2j},…,x_{nj}\}-min\{x_{1j},x_{2j},…,x_{nj}\}}
      对于越小越优型指标:归一化后的值为
      v_{ij} = \frac{max\{x_{1j},x_{2j},…,x_{nj}\}-x_{ij}}{max\{x_{1j},x_{2j},…,x_{nj}\}-min\{x_{1j},x_{2j},…,x_{nj}\}}

    3. 计算第j项指标下,第i个评价对象的特征比重

      对某个指标j,v_{ij}的值差异越大,表明该项指标对于被评价对象作用越大,即该项指标提供给被评价对象的有用信息越多。根据熵的概念,信息的增加意味着熵的减少,熵可以用来度量这种信息量的大小。

      记第j项指标下,第i个评价对象的特征比重,则p_{ij} = \frac{v_{ij}}{\sum_{i=1}^m v_{ij}}

       因为$0\leq v_{ij}\leq 1$,所以$0\leq p_{ij}\leq 1$
      
    4. 计算第j项指标的熵值e_j
      e_j = -\frac{1}{ln m}\sum_{i=1}^m p_{ij}ln(p_{ij})\\ 当p_{ij}=0或者p_{ij} = 1时,认为p_{ij}ln(p_{ij}) = 0.

    5. 计算第j项指标的差异性系数d_j

      观察熵值的计算公式,对于某一项指标D_j,v_{ij}的差异越小,e_j越大。当各被评价对象第j项指标值全相等时,e_j = e_{max} = 1

      根据熵的概念,各被评价对象第j项指标值差异越大,表明该指标反映的信息量越大。因此定义差异系数d_j = 1-e_j,d_j越大,该指标提供的信息量越大,应给予较大的指标权重。

    6. 确定各指标的熵权
      w_j = \frac{d_j}{\sum_{k=1}^n d_k},j=1,2,…,n

    熵值法:一种客观的赋权方法,它利用各指标的熵值所提供的信息量的大小来决定指标权重的方法。

    熵值法可以避免各评价指标权重的认为因素干扰,使评价结果更符合实际。但是熵值法不能减少评价指标的维数

    相关文章

      网友评论

          本文标题:数学建模系列笔记5:综合评价和因子分析

          本文链接:https://www.haomeiwen.com/subject/lfjnlrtx.html