什么是粗糙集(五)

作者: 思想永不平凡 | 来源:发表于2020-02-22 15:43 被阅读0次

本节我们将继续介绍粗糙集有关的概念。



上节我们介绍了知识粒度的度量,本节将介绍知识粒度的矩阵表示形式。

我们先简单介绍矩阵的相关概念。

矩阵

先看矩阵的和,差。

矩阵的和:
A=(a_{ij})_{m \times n}B=(b_{ij})_{m \times n}是两个m \times n的矩阵,则两个矩阵的和C=(c_{ij})_{m \times n}
C = A+B \quad \Longrightarrow \quad c_{ij}=a_{ij}+b_{ij}

=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{bmatrix} + \begin{bmatrix} b_{11} & b_{12} & \cdots & b_{1n} \\ b_{21} & b_{22} & \cdots & b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ b_{m1} & b_{m2} & \cdots & b_{mn} \\ \end{bmatrix}

=\begin{bmatrix} a_{11}+b_{11} & a_{12}+b_{12} & \cdots & a_{1n}+b_{1n} \\ a_{21}+b_{21} & a_{22}+b_{22} & \cdots & a_{2n}+b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1}+b_{m1} & a_{m2}+b_{m2} & \cdots & a_{mn}+b_{mn} \\ \end{bmatrix}

类似的,两个矩阵的差:
C = A-B \quad \Longrightarrow \quad c_{ij}=a_{ij}-b_{ij}

=\begin{bmatrix} a_{11}-b_{11} & a_{12}-b_{12} & \cdots & a_{1n}-b_{1n} \\ a_{21}-b_{21} & a_{22}-b_{22} & \cdots & a_{2n}-b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1}-b_{m1} & a_{m2}-b_{m2} & \cdots & a_{mn}-b_{mn} \\ \end{bmatrix}
矩阵的转置:
A= \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix}

则矩阵A的转置矩阵A^T为:
A^T=\begin{bmatrix} a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn} \\ \end{bmatrix}
最后来看矩阵的乘积:
A=(a_{ij})_{m \times n}B=(b_{ij})_{n \times p}是两个矩阵
则两个矩阵的乘积A \times B =C=(c_{ij})_{m \times p} 为:
C = A \times B \quad \Longrightarrow \quad (c_{ij})_{m \times p}=(\sum_{k=1}^{n} a_{ik}\cdot b_{kj})_{m \times p}

=\begin{bmatrix} \sum_{k=1}^{n} a_{1k}b_{k1} & \sum_{k=1}^{n}a_{1k}b_{k2} & \cdots & \sum_{k=1}^{n} a_{1k}b_{kp} \\ \sum_{k=1}^{n} a_{2k}b_{k1} & \sum_{k=1}^{n}a_{2k}b_{k2} & \cdots & \sum_{k=1}^{n} a_{2k}b_{kp} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_{k=1}^{n} a_{mk}b_{k1} & \sum_{k=1}^{n}a_{mk}b_{k2} & \cdots & \sum_{k=1}^{n} a_{mk}b_{kp} \\\end{bmatrix}

知识粒度的矩阵表现形式

我们依旧使用该表

U a b c e f d
1 0 1 1 1 0 1
2 1 1 0 1 0 1
3 1 0 0 0 1 0
4 1 1 0 1 0 1
5 1 0 0 0 1 0
6 0 1 1 1 1 0
7 0 1 1 1 1 0
8 1 0 0 1 0 1
9 1 0 0 1 0 0

等价关系矩阵的定义如下:
S=(U,A=C \bigcup D,V,f)是一个决策信息系统,论域U=\{u_{1},u_{2},...,u_{n} \}n是论域内元素个数,U/C=\{X_{1},X_{2},...,X_{m}\}R_{C}是论域U的等价关系。则等价关系矩阵U_{U}^{R_{C}} = (m_{ij})_{n \times n}定义如下:
m_{ij}= \begin{cases} 1 & (u_{i},u_{j}) \in R_{C} \\ 0 & (u_{i},u_{j}) \notin R_{C} \end{cases}

其中,{1 \leq i,j \leq n}

基于矩阵的知识粒度如下:
S=(U,A=C \bigcup D,V,f)是一个决策信息系统,U_{U}^{R_{C}} = (m_{ij})_{n \times n}是等价关系矩阵,条件属性C基于矩阵的知识粒度定义如下:
GP_{U}(C)= \frac{sum\left(M_{U}^{R_{C}}\right)}{|U|^{2}}=\overline{M_{U}^{R_{C}}}
其中,sum\left(M_{U}^{R_{C}}\right)是等价矩阵内1的个数总和,\overline{M_{U}^{R_{C}}}是矩阵内所有元素的均值。

依旧上表,我们可以计算G P_{U}(C)
\begin{equation} G P_{U}(C)=\overline{M_{U}^{R_{C}}}=\frac{1}{81} \times \operatorname{sum}(\left[\begin{array}{ccccccccc} {1} & {0} & {0} & {0} & {0} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} & {1} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} & {1} \end{array}\right]) \end{equation}=\frac{17}{81 }
这和我们在上节计算得到的结果是一致的。


类似的,相对知识粒度的定义如下:
S=(U,A=C \bigcup D,V,f)是一个决策信息系统,U_{U}^{R_{C}}U_{U}^{R_{C \bigcup D}}是等价关系矩阵,则决策属性D关于条件属性C基于矩阵的相对知识粒度定义如下:
G P_{U}(D\mid C)=\overline{U_{U}^{R_{C}}}-\overline{U_{U}^{R_{C \bigcup D}}}

根据上表,我们可以计算GP_{U}(D \mid C):
GP_{U}(D \mid C)=\overline{U_{U}^{R_{C}}}-\overline{U_{U}^{R_{C \bigcup D}}}

=\frac{1}{81}\times\operatorname{sum}(\left[\begin{array}{ccccccccc} {1} & {0} & {0} & {0} & {0} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} & {1} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} & {1} \end{array}\right] - \left[\begin{array}{ccccccccc} {1} & {0} & {0} & {0} & {0} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} & {0} \\ {0} & {0} & {1} & {0} & {1} & {0} & {0} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {1} & {1} & {0} & {0} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} & {0} \\ {0} & {0} & {0} & {0} & {0} & {0} & {0} & {0} & {1} \end{array}\right]) =\frac{2}{81}
这与我们之前计算的结果是一致的。



类似的,基于矩阵的内外部属性重要度的定义如下:
内部属性重要度:
S=(U,A=C \bigcup D,V,f)是一个决策信息系统,B \subseteq C,且U_{U}^{R_{B}}U_{U}^{R_{B-\{a\} }},U_{U}^{R_{B \bigcup D}},U_{U}^{R_{(B -\{a\}) \bigcup D}}都是等价关系矩阵,\forall a \in B,则属性a关于条件属性B相对于决策属性集D的基于矩阵的相对知识粒度定义如下:
\operatorname{Sig}_{U}^{inner }(a, B, D)=GP_{U}(D \mid B-\{a\})-GP_{U}(D \mid B)

=\{ GP_{U}(B-\{a\})-GP_{U}((B-\{a\}) \bigcup D) \}-\{GP_{U}(B)-GP_{U}(B \bigcup D) \}

=\overline{M_{U}^{R_{B-\{a \}}}}-\overline{M_{U}^{R_{(B -\{a\}) \bigcup D}}}-\overline{M_{U}^{R_{B}}}+\overline{M_{U}^{R_{B \bigcup D}}}


外部属性重要度:
S=(U,A=C \bigcup D,V,f)是一个决策信息系统,B \subseteq C,且U_{U}^{R_{B}}U_{U}^{R_{B \bigcup D}},U_{U}^{R_{B \bigcup \{a\} }},U_{U}^{R_{(B \bigcup \{a\}) \bigcup D}}都是等价关系矩阵,\forall a \in (C-B),则属性a关于条件属性B相对于决策属性集D的基于矩阵的相对知识粒度定义如下:
\operatorname{Sig}_{U}^{outer }(a, B, D)=GP_{U}(D \mid B)-GP_{U}(D \mid B \bigcup \{a\})

=\{ GP_{U}(B)-GP_{U}(B\bigcup D)\} - \{ GP_{U}(B \bigcup \{a\})-GP_{U}((B\bigcup \{a\}) \bigcup D) \}

=\overline{M_{U}^{R_{B}}}-\overline{M_{U}^{R_{B \bigcup D}}}-\overline{M_{U}^{R_{B \bigcup \{a \} }}}+\overline{M_{U}^{R_{(B \bigcup \{a\}) \bigcup D}}}


参考上节的案例,如果使用矩阵表示的话,结果是一样的,但是基于矩阵的方式在面对大规模数据集是可能不是好的选择。

本文内容暂告一段落,之后将继续更新。



本文参考了:

  • 景运革. 基于知识粒度的动态属性约简算法研究[D].西南交通大学,2017.

相关文章

  • 什么是粗糙集(五)

    本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的度量,本节将介绍知识粒度的矩阵表示形式。 我们先简单...

  • 什么是粗糙集?粗糙集理论简介。

    粗糙集理论,是继概率论、模糊集、证据理论之后的有一个处理不确定性的数学工具。于1982年 波兰理工大学Z.pawl...

  • 什么是粗糙集(一)

    前言:最近一直在学Relief算法,属于特征选择的方面。而我想起了之前一直做的粗糙集,基于粗糙集的特征选择称为属性...

  • 什么是粗糙集(二)

    前言:之前,我简要地介绍了粗糙集,趁着双休日的空闲之余,我将继续更新粗糙集方面的一些概念。我会尽量以通俗易懂的语言...

  • 什么是粗糙集(三)

    很久之前,写过粗糙集方面的东西,然鹅鸽了......最近开始更特征选择了,因此粗糙集又重新开始更了! 粗糙集方面很...

  • 什么是粗糙集(四)

    本节我们将继续介绍粗糙集有关的概念。 本节将介绍经典粗糙集中粒度的度量相关概念。我们依旧使用这个决策信息系统为例。...

  • 什么是粗糙集(六)

    本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的矩阵表示形式,本节将介绍基于知识粒度属性约简定义和算...

  • 利用粗糙集进行西瓜分类(上)

    最近在学习粗糙集,但是其抽象的概念令我学习异常吃力。我使用的是周炜编著的《粗糙集理论及应用》,这本书概念居多,很多...

  • 粗糙集

  • 粗糙集概念

    转载:百度文库一种对集合A的划分就对应着关于A中元素的一个知识 面对日益增长的数据库,人们将如何从这些浩瀚的数据中...

网友评论

    本文标题:什么是粗糙集(五)

    本文链接:https://www.haomeiwen.com/subject/ssflqhtx.html