XML规范简单理解

作者: 引颈歌者 | 来源:发表于2013-04-26 10:58 被阅读0次

    xml 的特性

    1. xml的设计宗旨是传输数据,而html宗旨是显示内容。

    2. xml有自我描述性。

    3. 需要自定义标签。

    4. xml元素指的是从标签开始到结束的部分。元素可以包含其他元素,文本或者两者的混合物。

       <bookstore>
           <book category="CHILDREN">
               <title>Harry Potter</title>
               <author>J K. Rowling</author>
               <year>2008</year>
               <price>99.99</price>
           </book>
       </bookstore>
      

    上例子中,只有book有属性。

    xml的命名规则

    1. 名称可以含有数字,字母和其他字符。
    2. 不能以数字或者标点开始。
    3. 不能以xml开始。
    4. 不能包含空格。
    5. 避免有中划线"-"。可以使用下划线"_"。
    6. 避免":"。冒号会被转换为命名空间使用。
    7. 空标签的写法:<noelement></noelement>或者<noelelment />。

    W3C对xml的一些规定

    1. xml对大小写敏感。
    2. 必须正确的嵌套。
    3. 必须有根元素。
    4. 属性值必须加引号。单引号和双引号都可以。
    5. 文本中的<必须被&lt代替。否则解析错误。
    6. 注释和html相同。
    7. xml中以\n来存储换行,win以\r\n存储换行,linux和unix以\r存储换行。
    8. 建议xml少用属性:属性无法包含多重值,属性无法描述为树结构,属性不易扩展,属性难以阅读。
    9. 元数据==存储数据的数据应当存储为属性。

    xml的DTD(文档类型定义)

    DTD的作用是定义xml的文档结构,使用一系列合法的元素来定义文档结构:

        <!DOCTYPE note [
            <!ELEMENT note ( to, from, heading, body ) >
            <!ELEMENT to ( #PCDATA )>
            <!ELEMENT from ( #PCDATA ) >
            <!ELEMENT heading ( #PCDATA )>
            <!ELEMENT body (#PCDATA) >
        ]>
    

    而W3C支持一种基于XML的DTD代替者,名字为XML Schema:

        <xs:element name="note">
        <xs:complexType>
            <xs:sequence>
                <xs:element name="to" type="xs:string" />
                <xs:element name="from" type="xs:string" />
                <xs:element name="heading" type="xs:string" />
                <xs:element name="body" type="xs:string" />
            </xs:sequence>
        </xs:complexType>
        </xs:element>
    

    xml有命名空间

    如果两个xml文件同时使用相同的元素名称,那么命名会起冲突。
    例如,一个表格:

    <table>
        <tr>
        <td>Apple</td>
        </tr>
    </table>
    

    一个有关桌子的信息:

    <table>
        <name>Coffee table</name>
        <width>20</width>
    </table>
    

    使用前缀

    某个表格信息可以表示为:

    <h: table>
        <h: tr>
        <h: td>Apple</h:td>
        </h: tr>
    </h:table>
    

    某个家具信息:

    <f:table>
        <f:name>Coffee table</f:table>
        <f:width>20</f:width>
    </f:table>
    

    使用命名空间

    <h:table xmlns:h="http://www.w3.org/html4">
        <h: tr>
        <h: td>Apple</h:td>
        </h: tr>
    </h:table>
    

    带有家具信息的xml:

    <f:table xmlns:f="http://www.w3.org/furniture">
        <f:name>Coffee table</f:table>
        <f:width>20</f:width>
    </f:table>
    

    通过xmlns将此xml与某个命名空间相关联。

    默认命名空间

    如果每次在元素前面加f:或者h:是件很繁琐的事情,以下办法就可以省去命名空间的前缀:

    xmlns="namespaceURI"
    

    xml文档的解析

    xml文档中的所有文本均会被解析,这是由于每个元素中可能嵌套其他元素。

    <message>此处文本会被解析</message>
    

    除非用CDATA来标识出不应该被解析的部分

    CDATA部分以"<!CDATA["开始,以"]]>"结束。

    <script>
    <![CDATA[
    function matchwo(a,b)
    {
        if (a < b && a < 0) then
        {
            return 1;
        }
        else
        {
            return 0;
        }
    }
    ]]>
    </script>
    

    xml编码

    编码方式

    xml需要编码为unicode编码。

    相关文章

      网友评论

        本文标题:XML规范简单理解

        本文链接:https://www.haomeiwen.com/subject/pfgttttx.html