XML解析

XML：eXtensible Markup Language 可扩展标记语言 version="1.0"
* 可扩展：所有的标签都是自定义的。
* 功能：数据存储
* 配置文件
* 数据传输
* html与xml区别：
* html语法松散，xml语法严格
* html做页面展示，xml做数据存储
* html所有标签都是预定义的，xml所有标签都是自定义的

W3C:word wide web consortiem 万维网联盟
xml语法：

文档声明：
* 必须写在xml文档的第一行。
* 写法：<?xml version="1.0" ?>
* 属性：
* version：版本号固定值 1.0
* encoding:指定文档的码表。默认值为 iso-8859-1
* standalone：指定文档是否独立 yes 或 no
元素：xml文档中的标签
** 文档中必须有且只能有一个根元素
* 元素需要正确闭合。<body></body>

* 元素需要正确嵌套
* 元素名称要遵守：
* 元素名称区分大小写
* 数字不能开头
文本：
* 转义字符：>
* CDATA: 里边的数据会原样显示
* <![CDATA[ 数据内容 ]]>
属性：
* 属性值必须用引号引起来。单双引号都行
* 注释：

* 处理指令：现在基本不用
<?xml-stylesheet type="text/css" href="1.css"?>

xml约束：
* 约束就是xml的书写规则
* 约束的分类：
dtd：
dtd分类：
* 内部dtd：在xml内部定义dtd
* 外部dtd：在外部文件中定义dtd
* 本地dtd文件：<!DOCTYPE students SYSTEM "student.dtd">
* 网络dtd文件：<!DOCTYPE students PUBLIC "名称空间" "student.dtd">
schema：
导入xsd约束文档：
1、编写根标签
2、引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
3、引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
4、引入默认的名称空间

XML解析：

解析xml可以做：
如果xml作为配置文件：读取
如果xml作为传输文件：写，读
xml解析思想：

DOM：Document Object Model，文档对象模型。这种方式是W3C推荐的处理XML的一种方式，将文档加载进内存，形成一颗dom树，可以对dom树进行增删改查。
优点：可以对dom树进行增删改查。
缺点：dom树非常占内存，解析速度慢。
Document
Element
Text
Attribute
Comment
SAX：Simple API for XML。这种方式不是官方标准，属于开源社区XML-DEV，几乎所有的XML解析器都支持它,逐行读取，基于事件驱动。
优点：不占内存，速度快。
缺点：只能读取，不能回写。

xml常用解析器:

JAXP：是SUN公司推出的解析标准实现。

JAXP:(Java API for XML Processing)开发包是JavaSE的一部分，sun公司提供的解析,支持dom和sax。它由以下几个包及其子包组成：
org.w3c.dom:提供DOM方式解析XML的标准接口
org.xml.sax:提供SAX方式解析XML的标准接口
javax.xml:提供了解析XML文档的类
javax.xml.parsers包中，定义了几个工厂类。我们可以通过调用这些工厂类，得到对XML文档进行解析的DOM和SAX解析器对象。
DocumentBuilderFactory
SAXParserFactory

Dom4J：是开源组织推出的解析开发包,结合了上面的优点。(牛，大家都在用，包括SUN公司的一些技术的实现都在用)

1.导入dom4j.jar
2.创建解析器   SAXReader reader = new SAXReader();
3.解析xml获得document对象
Document document = reader.read(url);

XPATH 专门用于查询

定义了一种规则
使用方法：selectSingleNode();
        selectNodes();
使用步骤：
1、注意：要导包 jaxen...jar
2、创建解析器
SAXReader reader = new SAXReader();
3、解析xml 获得document对象 
Document document = reader.read(url);