美文网首页
和转义字符

和转义字符

作者: 我弟是个程序员 | 来源:发表于2018-12-13 18:27 被阅读0次

    所有 XML 文档中的文本均会被解析器解析。
    只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。

    一、转义字符

    非法的 XML 字符必须被替换为实体引用(entity reference)。

    在 XML 元素中,"<" 和 "&" 是非法的。

    • "<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
    • "&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

    在 XML 中有 5 个预定义的实体引用:

    参数名 类型 说明
    &lt; < 小于
    &gt; > 大于
    &amp; & 和号
    &apos; ' 省略号
    &quot; " 引号

    注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

    二、<![CDATA[]]>

    <![CDATA[]]>这个标记所包含的内容将表示为纯文本,比如<![CDATA[<]]>表示文本内容“<”

    此标记用于xml文档中,我们先来看看使用转义符的情况。我们知道,在xml中,”<”、”>”、”&”等字符是不能直接存入的,否则xml语法检查时会报错,如果想在xml中使用这些符号,必须将其转义为实体,如”&lt;””&gt;””&amp;”,这样才能保存进xml文档。
      
    在使用程序读取的时候,解析器会自动将这些实体转换回”<”、”>”、”&”。举个例子:

      <age> age < 30 </age> 
    

    上面这种写法会报错,应该这样写:

      <age> age &lt; 30 </age> 
    

    值得注意的是:
      (1) 转义序列字符之间不能有空格;
      (2) 转义序列必须以”;”结束;
      (3) 单独出现的”&”不会被认为是转义的开始;
      (4) 区分大小写。
      
      不管怎么样,转义前的字符也好,转义后的字符也好,都会被xml解析器解析,为了方便起见,使用<![CDATA[]]>来包含不被xml解析器解析的内容。但要注意的是:
      (1) 此部分不能再包含”]]>”
      (2) 不允许嵌套使用;
      (3) ”]]>”这部分不能包含空格或者换行。
      
    最后,说说<![CDATA[]]>xml转移字符的关系,它们两个看起来是不是感觉功能重复了?

    是的,它们的功能就是一样的,只是应用场景和需求有些不同:
      (1) <![CDATA[]]>不能适用所有情况,转义字符可以;
      (2) 对于短字符串<![CDATA[]]>写起来啰嗦,对于长字符串转义字符写起来可读性差;
      (3) <![CDATA[]]>表示xml解析器忽略解析,所以更快。

    相关文章

      网友评论

          本文标题:和转义字符

          本文链接:https://www.haomeiwen.com/subject/cqwbhqtx.html