前一篇介绍知识图谱简单的理解就是将现实世界客观存在的实体,概念以及之间的关系抽象成图数据结构,使其在计算机上可以处理。
如何才能在计算机上可处理呢?答案是用计算机可识别的标准化语言去描述。
在不同机器间进行交换任意数据的标准化语言需要包含以下三个方面:
1、数据模型
数据模型告诉我们数据的结构和组织形式
2、语法
语法告诉我们如何去撰写数据
3、语义
语义告诉我们如何去理解数据
一、数据模型
知识图谱来源于语义网,用RDF这种资源描述框架,基本概念包括资源、属性、声明和图
1、资源
资源可以理解为一个对象,可以是作者、明星、地点、人,旅馆等。每个资源都有一个唯一的标识符。
2、属性
属性是一类特殊的资源,它们描述了资源之间的关系。例如:位于,撰写。和其他资源一样,属性也有唯一的标识符
3、声明
声明断言了资源的属性。一个声明是一个实体-属性-取值的三元组,由一个资源、一个属性和一个属性值组成。属性值要么是一个资源,要么是一个文字。文字是原子值,例如,数字、字符串或日期
例如:胡歌,身高,180
胡歌,好友,蒋劲夫
使用图形化的方式书写上面的声明
![](https://img.haomeiwen.com/i3077248/ef6bc2b61379096e.png)
二、语法
可用于编写RDF的语法有Turtle、RDF/XML、RDFa、JSON-LD
三、语义
不管是用什么样的语法去写RDF中的声明,但是计算机并不清楚这些声明的含义是什么?应该如何解释这些声明?
拿这个(胡歌,籍贯,上海)这个声明解释一下,想一想我们自己如何知道这个声明的语义呢?
-- 胡歌(我们会想他是人,胡歌是人这个类中的一个实例)
-- 籍贯(一个属性,哪些类有个这个属性?)
--上海(一个城市,它是城市这个类的一个实例)
很明显理解这样的声明,计算机需要知道类别属性这样的信息
RDFS是对类和属性的建模,它定义类和属性及其层次和继承关系。RDFS和RDF二者的关系如下图:
![](https://img.haomeiwen.com/i3077248/c094bd2cca663db7.png)
网友评论