XML解析
XML:eXtensible Markup Language 可扩展标记语言 version="1.0"
* 可扩展:所有的标签都是自定义的。
* 功能:数据存储
* 配置文件
* 数据传输
* html与xml区别:
* html语法松散,xml语法严格
* html做页面展示,xml做数据存储
* html所有标签都是预定义的,xml所有标签都是自定义的
W3C:word wide web consortiem 万维网联盟
xml语法:
-
文档声明:
* 必须写在xml文档的第一行。
* 写法:<?xml version="1.0" ?>
* 属性:
* version:版本号 固定值 1.0
* encoding:指定文档的码表。默认值为 iso-8859-1
* standalone:指定文档是否独立 yes 或 no -
元素:xml文档中的标签
** 文档中必须有且只能有一个根元素
* 元素需要正确闭合。<body></body>
* 元素需要正确嵌套
* 元素名称要遵守:
* 元素名称区分大小写
* 数字不能开头 -
文本:
* 转义字符:>
* CDATA: 里边的数据会原样显示
* <![CDATA[ 数据内容 ]]> -
属性:
* 属性值必须用引号引起来。单双引号都行
* 注释:
* 处理指令:现在基本不用
<?xml-stylesheet type="text/css" href="1.css"?>xml约束:
* 约束就是xml的书写规则
* 约束的分类:
dtd:
dtd分类:
* 内部dtd:在xml内部定义dtd
* 外部dtd:在外部文件中定义dtd
* 本地dtd文件:<!DOCTYPE students SYSTEM "student.dtd">
* 网络dtd文件:<!DOCTYPE students PUBLIC "名称空间" "student.dtd">
schema:
导入xsd约束文档:
1、编写根标签
2、引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
3、引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
4、引入默认的名称空间
XML解析:
- 解析xml可以做:
- 如果xml作为配置文件:读取
- 如果xml作为传输文件:写,读
- xml解析思想:
-
DOM:Document Object Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式,将文档加载进内存,形成一颗dom树,可以对dom树进行增删改查。
优点:可以对dom树进行增删改查。
缺点:dom树非常占内存,解析速度慢。
Document
Element
Text
Attribute
Comment -
SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它,逐行读取,基于事件驱动。
优点:不占内存,速度快。
缺点:只能读取,不能回写。
xml常用解析器:
- JAXP:是SUN公司推出的解析标准实现。
JAXP:(Java API for XML Processing)开发包是JavaSE的一部分,sun公司提供的解析,支持dom和sax。它由以下几个包及其子包组成:
org.w3c.dom:提供DOM方式解析XML的标准接口
org.xml.sax:提供SAX方式解析XML的标准接口
javax.xml:提供了解析XML文档的类
javax.xml.parsers包中,定义了几个工厂类。我们可以通过调用这些工厂类,得到对XML文档进行解析的DOM和SAX解析器对象。
DocumentBuilderFactory
SAXParserFactory
- Dom4J:是开源组织推出的解析开发包,结合了上面的优点。(牛,大家都在用,包括SUN公司的一些技术的实现都在用)
1.导入dom4j.jar
2.创建解析器 SAXReader reader = new SAXReader();
3.解析xml获得document对象
Document document = reader.read(url);
- XPATH 专门用于查询
定义了一种规则
使用方法:selectSingleNode();
selectNodes();
使用步骤:
1、注意:要导包 jaxen...jar
2、创建解析器
SAXReader reader = new SAXReader();
3、解析xml 获得document对象
Document document = reader.read(url);
网友评论