(一)语义网从何而来
语义网源于语义网络。百科中是这样解释语义网络的
语义网络是一种以网络格式表达人类知识构造的形式。是人工智能程序运用的表示方式之一。由奎林(J. R. Quillian)于1968年提出,用于描述物体概念与状态及其间的关系。
利用语义网络的定义将一个陈述句呈现方式与思维导图有些类似,比如语句John gave the book to Mary的语义网络表示如下图:
image.png
语义网是有Tim Berners Lee 在1998年提出,目的是给万维网上的文档添加能够被计算机所理解的语义,从而使整个互联网成为通用的信息交换介质。为了能够使数据之间建立链接,语义网借鉴语义网络的思想,采用图结构对知识进行组织。
(二)语义信息如何能够被计算机“理解”和“操作”?
首先解决“理解”问题,采用如图所示设计
HTML语言通过浏览器编译,将信息以我们能看懂的方式展示出来,而计算机则可以通过XML来“理解”信息。XML指可扩展标记语言(eXtensible Markup Language),主要设计用来传输和存储数据。XML的这两个特点很符合用于实现web3.0的目标。XML的使用方式与HTML基本相同,但由于其目的用于传输和存储数据,因此可以自定义标签。因为其随意性(可自定义标签),因此需要一套标准来规范,这套规范也就是DTD(文档类型定义)的,主要定义 XML 文档的合法构建模块。然而这套定义的使用比较麻烦,使用前需要进行大量元素声明,为了简化,于是出现XmlSchema。
有了XML与XmlSchema,就可以对不同结构(网络上有结构化、非结构化数据)的数据进行存储,但是数据内容之间的关系如何表示?采用基于XML语法的RDF来实现。RDF有一套自己的语法体系。它由三个部分组成:RDF Data Model, RDF Schema 和 RDF Syntax。
RDF Data Model:用于描述特定资源,通过使用资源结点、属性类和属性值对该资源进行描述,资源结点、属性类和属性值被称为三元组。
RDF Schema:负责描述资源与资源之间的关系。
RDF Syntax:供计算机自动处理元数据的语法结构,它基于XML将各种元数据集成。
可以把RDF利用这三个部分将资源整合的过程看做是搭乐高的过程。乐高中不同大小的模块是RDF Data Model,不同模块之间的关系用颜色标记,这类似于RDF Schema的功能,按照乐高图把这些模块搭建起来的过程则相当于RDF Syntax的工作。
有了XML、RDF,信息可以存储,而且它们之间的关系可以被描述,但是还不能被扩展。于是OWL因此出现了。OWL是在本体描述语言DAML和OIL的基础上发展起来的,它可以在一个预定义的词汇表上增加词汇,描述各种资源之间的关系。
总结上图体系结构,也就是:
采用unicode和URI作为底层,unicode处理资源的编码,URI负责标志资源;
XML+NS+xmlschema表示数据的内容和结构;
RDF+rdfschema用户描述web上的资源及类型;
Ontology Vocabulary用于描述各种资源之间的关系。
类似写一本小说,首先确定使用哪种语言来写,接着搭建小说大体框架内容,在此基础上详细描写每个章节的内容,最后,确保每个章节之间的逻辑关系。
因此XML与RDF的区别是:XML可扩展信息资源,RDF来表达句子意思。
网友评论