XML与DTD

作者: Anseis | 来源:发表于2018-04-10 01:28 被阅读0次

一. DTD :

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。

DTD声明方式,有点类似HTML

<!DOCTYPE 根元素 [元素声明]>

DTD的作用:

通过 DTD,每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
我们还可以使用 DTD 来验证自身的数据。

二. XML 文档构建模块

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

  1. 元素
  2. 属性
  3. 实体
  4. PCDATA
  5. CDATA
    下面是每个构建模块的简要描述。

1. 元素

元素是 XML 以及 HTML 文档的主要构建模块。

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

实例:

<body>body text in between</body>
<message>some message in between</message>

2. 属性

属性可提供有关元素的额外信息。

属性总是被置于某元素的开始标签中。属性总是以名称/值的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:

<img src="computer.gif" />

3. 实体

实体是用来定义普通文本的变量。实体引用是对实体的引用。

大多数同学都了解这个 HTML 实体引用:" "。这个“无折行空格”实体在 HTML 中被用于在某个文档中插入一个额外的空格。

当文档被 XML 解析器解析时,实体就会被展开。

4. PCDATA

PCDATA 的意思是被解析的字符数据(parsed character data)。

可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。

PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。

文本中的标签会被当作标记来处理,而实体会被展开。

不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 实体来分别替换它们。

5. CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

以我个人理解,即元素在DTD中解析都为PCDATA,而属性因为不会被解析成数据那就用CDATA来定义类型

三. DTD设定

DTD - 元素

声明一个元素
在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:

<!ELEMENT 元素名称 类别(一般是#PCDATA)>
或者
<!ELEMENT 元素名称 (元素内容)(内含一些子元素,需要用到类似正则表达式的方法)>

DTD - 属性

在 DTD 中,属性通过 ATTLIST 声明来进行声明。
声明属性
属性声明使用下列语法:

<!ATTLIST 元素名称 属性名称 属性类型 默认值>

DTD 实例:

<!ATTLIST payment type CDATA "check">

XML 实例:

<payment type="check" />

假如不希望强制作者包含属性,并且没有默认值选项的话,使用关键词 #IMPLIED。
假如没有默认值选项,但是仍然希望强制作者提交属性的话,使用关键词 #REQUIRED。
这两种写法是目前我接触到的

DTD - 实体

实体是用于定义引用普通文本或特殊字符的快捷方式的变量。

实体引用是对实体的引用。

实体可在内部或外部进行声明。

一个内部实体声明

语法:

<!ENTITY 实体名称 "实体的值">

例子

<!ENTITY writer "Bill Gates">
<!ENTITY copyright "Copyright W3School.com.cn">

外部实体则是引用链接

下面写出斯坦福课后的一个练习作为例子

xml链接
写出可让上述xml生效的DTD

<!ELEMENT Course_Catalog (Department*)>
<!ATTLIST Department Code CDATA #REQUIRED>
<!ELEMENT Department (Title,Chair,Course*)>
<!ELEMENT Chair (Professor)>
<!ELEMENT Professor (First_Name,Middle_Initial?,Last_Name)>
<!ATTLIST Course Number CDATA #REQUIRED Enrollment CDATA #IMPLIED>
<!ELEMENT Course (Title,Description?,Instructors,Prerequisites?)>
<!ELEMENT Instructors (Lecturer|Professor)*>
<!ELEMENT Lecturer (First_Name,Middle_Initial?,Last_Name)>
<!ELEMENT Prerequisites (Prereq+)>
<!ELEMENT Title (#PCDATA)>
<!ELEMENT First_Name (#PCDATA)>
<!ELEMENT Middle_Initial (#PCDATA)>
<!ELEMENT Last_Name (#PCDATA)>
<!ELEMENT Description (#PCDATA)>
<!ELEMENT Prereq (#PCDATA)>

相关文章

  • XML与DTD

    一. DTD : 文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。 ...

  • XML约束——Schema约束

    Schema与DTD XML Schema符合XML语法结构。 DOM、SAX等XML API很容易解析出XML ...

  • XML2 - 约束

    DTD schema schema 与 DTD 的对比: schema符合XML的语法结构 DOM、SAX等容易解...

  • XML的验证模式

    DTD与XSD区别DTD(Document Type Definition)即文档类型定义,是一种XML约束模式语...

  • XML类别及解析XML的几种方式

    XML约束文档分为DTD,Schema两种格式 DTD DTD(Document Type Definition)...

  • DTD概念

    DTD文档定义 DTD元素定义 DTD属性定义 DTD实体引用定义 XML和DTD 文中大写是强制的,请务必遵守。...

  • XXE——参数实体攻击(CVE-2017-14949)

    XML参数实体 参数实体必须定义在单独的DTD文档中或XML文档的DTD区(但是引用只能在DTD文档中,即外部子集...

  • XML(二)XML约束

    XML约束 DTD DTD(Document Type Define),dtd文件中描述并规定了元素、属性和其他内...

  • Eclipse使用

    添加dtd文件 Window => Preferences => XML XML Catalog => add 例...

  • XML的验证模式DTD与XSD的区别

    xml文件的正确性是由xml的验证模式来保证的,比较常见的验证模式有两种:DTD和XSD。 1.DTD: DTD(...

网友评论

    本文标题:XML与DTD

    本文链接:https://www.haomeiwen.com/subject/hczwhftx.html