什么是粗糙集(三)

作者: 思想永不平凡 | 来源:发表于2020-02-20 15:09 被阅读0次

很久之前,写过粗糙集方面的东西,然鹅鸽了......最近开始更特征选择了,因此粗糙集又重新开始更了!



粗糙集方面很久没更了,上一篇还是去年七月下旬,之后很久没更这块了,博客也很长时间没更新。最近在更特征选择,恰好最近一位读者私信我还会写粗糙集这块吗,当然会的啦。
闲话少说,开始吧!

本文与之前的博客一脉相承。

上近似和下近似

之前病人病历为例,这里我们使用体温这个属性。

病人 体温
e_{1} 正常
e_{2}
e_{3} 很高
e_{4} 正常
e_{5}
e_{6} 很高

在这个信息系统中 S=(U,C),其中U为论域,C=\{c_{3} \}c_{3}是体温这个属性。
那么,
U/C=\{\{e_{3},e_{6} \},\{e_{2},e_{5} \},\{e_{1},e_{4}\}\}=\{X_{1},X_{2},X_{3}\}

可以看出体温这个属性被划分成了三类,很高,高和正常。

若给定一个集合XX=\{e_{1},e_{2},e_{4} \},显然XC的粗糙集,因为X不能被X_{1},X_{2},X_{3}中的任何一个或者若干个组合构成。

先看上近似。
U/C=\{X_{1},X_{2},X_{3} \}中,

\{e_{3},e_{6}\}\bigcap X =\emptyset \quad \implies \quad X_{1} \bigcap X = \emptyset
\{e_{2},e_{5}\} \bigcap X =\{e_{2} \} \quad \implies \quad X_{2} \bigcap X = \{e_{2}\}
\{e_{1},e_{4} \} \bigcap X =\{e_{1},e_{4}\} \quad \implies \quad X_{3} \bigcap X = \{e_{1},e_{4} \}

此时,称\{e_{2},e_{5} \}\{e_{1},e_{4}\}X关于C的上近似。

再看下近似。
U/C=\{X_{1},X_{2},X_{3} \}中,

\{e_{3},e_{6} \}\not\subseteq X \quad \implies \quad X_{1} \not\subseteq X
\{e_{2},e_{5} \}\not\subseteq X \quad \implies \quad X_{2} \not\subseteq X

\{e_{1},e_{4} \} \subseteq X \quad \implies \quad X_{3} \subseteq X
此时,称\{e_{1},e_{4}\}X关于C的下近似。

给出上下近似的定义:

在一个决策信息系统中S=(U,A=C\bigcup D,V,f)中,R是一个等价关系,\forall X \subseteq UX关于R的上近似和下近似的定义分别如下:

\overline{R}X=\{x \in U \mid [x]_{R} \bigcap X \neq \emptyset \}
\underline{R}X= \{x \in U \mid [x]_{R} \subseteq X\}

[x]_{B}=\{y \mid (x,y) \in R_{B} \}表示是由等价关系R_{B}形成的等价类,在往期的博客中有相关介绍,传送门

关于上近似和下近似的一些解释。

  • 上近似则是将那些包含X的知识库中的集合求并得到的(包含X的最小可定义集)
  • 下近似是在那些所有的包含于X的知识库中的集合中求并得到的(包含在X内的最大可定义集)

或者说

  • 上近似是根据现有知识R,判断U中一定属于和可能属于X的对象所组成的集合。
  • 根据现有知识R,判断U中所有肯定属于X的对象所组成的集合,即式中,表示等价关系R下包含关系x的等价类。

正域,负域与边界域

紧接着上下近似的概念,正域,负域与边界域的定义如下:

论域UX的上下近似集划分为正域POS_{R}(X),负域NEG_{R}(X)以及边界域BND_{R}(X)三个互不相交的区域。
正域:
POS_{R}(X)=\underline{R}X

负域:
NEG_{R}(X)=U-\overline{R}X

边界域:
BND_{R}(X)=\overline{R}X-\underline{R}X

可以发现:
POS_{R}(X) \bigcup NEG_{R}(X) \bigcup BND_{R}(X) =U

我们还是以上面体温属性C为例。
X关于C的上近似为\{e_{2},e_{5}\}\{e_{1},e_{4}\},下近似为\{e_{1},e_{4}\},所以
论域UX的上下近似集划分为正域为:
POS_{C}(X)=\underline{R}X=\{e_{1},e_{4}\}

负域为:
NEG_{R}(X)=U-\overline{R}X =\{e_{3},e_{6} \}

边界域:
BND_{R}(X)=\overline{R}X-\underline{R}X=\{e_{2},e_{5} \}

用一张图来表示这个过程:

image.png

图中蓝色曲线为上近似。

实例

下表是一个决策信息系统。

U a b c e f d
1 0 1 1 1 0 1
2 1 1 0 1 0 1
3 1 0 0 0 1 0
4 1 1 0 1 0 1
5 1 0 0 0 1 0
6 0 1 1 1 1 0
7 0 1 1 1 1 0
8 1 0 0 1 0 1
9 1 0 0 1 0 0

其中论域U=\{1,2,3,4,5,6,7,8,9 \},条件属性集C=\{a,b,c,f,e \},决策属性集 D=\{d\}

从上表中有:U=\{x_{1},x_{2},x_{3},x_{4},x_{5},x_{6},x_{7},x_{8},x_{9}\}C=\{a,b,c,f,e \}D=\{d\}
每个属性的值域都为\{0,1\}

U/C=\{\{1\},\{2,4\},\{3,5\},\{6,7\},\{8,9\} \}=\{U_{1},U_{2},U_{3},U_{4},U_{5} \}

注意,C是条件属性,未包括决策属性d

假设:X=\{1,2,3,6,7 \}
则:
上近似:
\overline{R}X=U_{1} \bigcup U_{2} \bigcup U_{3} \bigcup U_{4} =\{1,2,4,3,5,6,7 \}

下近似:
\underline{R}X= \{1,6,7\}
正域为:
POS_{C}(X)=\underline{R}X=\{1,6,7 \}
负域为:
NEG_{C}(X)=U-\overline{R}X =\{8,9 \}
边界域:
BND_{C}(X)=\overline{R}X-\underline{R}X=\{2,4,3,5\}

本文内容暂告一段落,之后将继续更新。



本文参考了:

  • 景运革. 基于知识粒度的动态属性约简算法研究[D].西南交通大学,2017.
  • 苗夺谦,李国道《粗糙集理论,算法和应用》.
  • 张文修《基于粗糙集的不确定决策》.

相关文章

  • 什么是粗糙集(三)

    很久之前,写过粗糙集方面的东西,然鹅鸽了......最近开始更特征选择了,因此粗糙集又重新开始更了! 粗糙集方面很...

  • 什么是粗糙集?粗糙集理论简介。

    粗糙集理论,是继概率论、模糊集、证据理论之后的有一个处理不确定性的数学工具。于1982年 波兰理工大学Z.pawl...

  • 什么是粗糙集(一)

    前言:最近一直在学Relief算法,属于特征选择的方面。而我想起了之前一直做的粗糙集,基于粗糙集的特征选择称为属性...

  • 什么是粗糙集(二)

    前言:之前,我简要地介绍了粗糙集,趁着双休日的空闲之余,我将继续更新粗糙集方面的一些概念。我会尽量以通俗易懂的语言...

  • 什么是粗糙集(四)

    本节我们将继续介绍粗糙集有关的概念。 本节将介绍经典粗糙集中粒度的度量相关概念。我们依旧使用这个决策信息系统为例。...

  • 什么是粗糙集(五)

    本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的度量,本节将介绍知识粒度的矩阵表示形式。 我们先简单...

  • 什么是粗糙集(六)

    本节我们将继续介绍粗糙集有关的概念。 上节我们介绍了知识粒度的矩阵表示形式,本节将介绍基于知识粒度属性约简定义和算...

  • 利用粗糙集进行西瓜分类(上)

    最近在学习粗糙集,但是其抽象的概念令我学习异常吃力。我使用的是周炜编著的《粗糙集理论及应用》,这本书概念居多,很多...

  • 粗糙集

  • 粗糙集概念

    转载:百度文库一种对集合A的划分就对应着关于A中元素的一个知识 面对日益增长的数据库,人们将如何从这些浩瀚的数据中...

网友评论

    本文标题:什么是粗糙集(三)

    本文链接:https://www.haomeiwen.com/subject/iamzfhtx.html