xml基本知识点

作者: 知识学者 | 来源:发表于2018-03-19 10:04 被阅读36次

    xml, Extensible Markup Language,可扩展的标记语言。

    xml文档结构.jpg

    xml文档的规则
    1.0 xml文档必须以一个xml声明开始
    2.0 xml文档有且只有一个根元素。
    3.0 开始标记和结束标记必须成对出现。
    4.0 各元素之间正确嵌套。
    5.0 xml标记都是大小写敏感的。
    6.0 属性必须用引号" ";



    列子
    <?xml version="1.0" encoding="utf-8"?>
    <!-- 我是注释 -->
    <魔鬼名单>
    
    <魔鬼 职务="天使长">
    <name>路西法</name>
    <age>9999</age>
    <sex>man</sex>
    </魔鬼>
    <魔鬼>
    <name>洛基</name>
    <age>6666</age>
    <sex>man</sex>
    </魔鬼>
    
    </魔鬼名单>
    
    结果

    <?xml version="1.0" encoding="utf-8"?> 是xml的声明,以<?xml 开始,以?>结束,version是版本(好像只能取1.0),encoding是字符编码。

    xml元素命名规范
    与html不同,xml没有预置任何元素,允许开发者自定义,但是有规范。
    1.0 名字必须以 _(下划线)或者字母开头。
    2.0 名字不能出现xml,Xml等任意大小写组合开始。
    。。。。。。

    xml的属性
    形式 <开始标记 属性1=" 属性值1 ",属性2=" 属性值2 "........> 数据内容 </结束标记>
    规则:
    1.0 属性命名规则同元素命名。
    2.0 属性值必须用引号值括起来。
    3.0 属性值只能包含在开始标记。
    4.0 特定的属性名称在同一元素只能出现一次。

    一个元素特征可以用其子元素来表示,属性可以描述元素特征,但是定义过多属性会降低程序可读性。

    <date year="2018" month="3" day="19"></date>
    
    <date>
      <year>2018</year>
      <month>3</month>
      <day>19</day>
    </date>
    

    上面2个是等价的。

    空元素
    如果元素不包含任何文本,那么它就是空元素,空元素不可接受字元素。
    形式: <标记名称 属性列表/> 或者 <标记名称/> 或者 <标记名称></标记名称>

    <dflx/>
    <dflx></dflx>
    <dflx lover="雨"/>
    

    由于空元素不包含任何内容,因此在编写xml的时候,空元素主要用于抽象带有属性的数据,该数据本身并不需要用具体的文本来进行描述。

    元素嵌套
    1.0 父元素的起始标记必须在子元素的起始标记前,父元素的结束标记必须在子元素的结束标记后,元素之间不可交叉嵌套。
    2.0 子元素和子元素间是兄弟关系。
    3.0 二个元素之间不能即是父子关系又是兄弟关系。

    实体引用和CDATA段
    开始标记和结束标记之间的文本可以是任何Unicode字符,但是如果文本包含一些特殊的字符,可以采用实体引用或者CDATA段。
    比如:
    <exprect>1+1&lt;6</exprect>
    结果是:

    <exprect>1+1<6</exprect>
    

    xml预置的5个实体引用。
    '&lt' 所代表的符号<, &gt;所代表的符号为>
    '&' 所代表的符号为&,

    &apos; 所代表的符号为';   &quot;所代表的符号为".
    

    如果文本包含大量的>,<,&等特殊符号,需要发大量时间转换,这时用CDATA段解决。
    格式: <![CDATA[文本内容]]>

    <python>
      <![CDATA[
      if(you love my article)
      plase mark me;
      ]]>
    </python>
    
    结果

    命名空间
    xml最大特点就是易扩展性,它允许用户自定义标记,这个给用户非常大的自由空间,但是同时也出现了标记名称重复性的问题。为解决标记名称相同的情况,采用命名空间解决。

    有前缀的命名空间: xmlns:前缀="命名空间的名字";
    无前缀的命名空间: xmlns=命名空间的名字;
    命名空间前缀不能用 xml, xmlns,并且前缀之间不能有空格。如果命名空间名字相同则称命名空间相同。

    xmlns:north="lz"
    xmlns:north="liao"
    

    这个只是前缀相同,名称空间不同。

    xmlns:hello="microsoft"
    xmlns:ok="microsoft"
    

    这2个命名空间相同,都是apple.

    在标记中声明命名空间必须放在开始标记,放在开始标记的标记名称空间后面。
    如果一个标记有声明前缀的命名空间,必须通过放在标记名称前面添加的空间前缀和冒号来引用命名空间。一个标记可以声明多个命名空间

    <student xmlns:class1="software" xmlns:class2="cs">
      <class1:张三>sex:man</class1:张三>
      <class2:李四>sex:man</class2:李四>
    </student>
    
    image.png

    命名空间的作用域:命名空间的作用域就是该命名空间的作用范围。
    1.0 一个无前缀的标记的命名空间作用域,是该标记及其子标记。
    2.0 如果是有前缀名称的标记命名空间,其子元素如果想属于该空间,需要通过引用名称空间的前缀来继承命名空间。

    <student xmlns:class1="software">
      <class1:张三>sex:man</class1:张三>
      <李四>sex:man</李四>
    </student>
    

    比如这个,张三属于software命名空间,李四就不输入。

    相关文章

      网友评论

        本文标题:xml基本知识点

        本文链接:https://www.haomeiwen.com/subject/usduqftx.html