XML解析之DOM4J解析

作者: 我和程序猿的日常 | 来源:发表于2017-02-15 17:30 被阅读0次

    前言:公司的APP很早就有了,之前的接口结果处理都是通过XML的方式,并且在项目中,每个人处理XML的方式各种各样,没有统一的处理方式,所以在运用中很苦恼,所以楼主每次在项目开发中,为了节省自己的时间,不在研究其他人员XML的解析方式,只要遇到XML的地方,楼主就用DOM4J的方式解析。

    关于XML的解析方式有好多种,DOM、SAX、JDOM等等,至于用法和原理这里就不在说了(ps:楼主也不知道用法和原理)。这篇文章主要说说DOM4J的简单操作和用法。

    DOM4J介绍

    dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。

    Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。

    这里用一个简单的例子来介绍DOM4J的用法。

    注意:使用DOM4J解析XML,需要在项目中引入DOM4J的jar包。下载地址

    XML文件

    <Response T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查询成功!' >
        <Media Name='IMG_20130425_141838.jpg' Mediasource ='1' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>图片1</Media>
        <Media Name='IMG_20130425_141838.jpg' Mediasource ='2' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>图片2</Media>
        <Media Name='IMG_20130425_141838.jpg' Mediasource ='3' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>图片3</Media>
    </Response>
    

    DOM4J使用详解

    步骤1:加载xml文件

    加载xml可以分为主要的两种方式

    1、直接加载文件所在的路径地址

    2、加载字符串形式的xml(此方式主要是用在服务器返回结果中)

    1.1、直接加载文件路径

            SAXReader reader = new SAXReader();
            Document document = null;
            try {
                document = reader.read(new File("E:\\CZBK\\day01\\caseUp.xml"));
            } catch (DocumentException e) {
                e.printStackTrace();
            }
    

    1.2、加载字符串形式的xml

        SAXReader reader = new SAXReader();
        Document document = null;
        try {
            //result是需要解析的字符串 
            //解析字符串需要转换成流的形式,可以指定转换字符编码
            document = reader.read(new ByteArrayInputStream(result.getBytes("UTF-8")));
        } catch (DocumentException  e) {
            e.printStackTrace();
        }
    

    步骤2:解析XML

    在解析XML之前,我们先来介绍下XML的结构称呼,清楚下面4个问题对解析XML很有帮助

    什么是节点(node)?什么是元素(element)?什么是属性(attribute)?什么是文本值(value)?

    节点:“Response”、“Media”这些称之为节点

    元素:以一个完整的标签结束称之为元素,包含整个元素内容。例如:<Media Name='IMG_20130425_141838.jpg' Mediasource ='1' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>图片1</media》

    属性:节点的属性值,对节点内容加之说明。例如:T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查询成功!'

    文本值:“图片1”称之为文本值。

    在项目中无非就是围绕元素、属性和文本值进行操作,所以掌握好这三部分的取值方法,也就掌握了XML解析。

    2.1、获取根节点

            //获取整个文档
            Element rootElement = document.getRootElement();
    

    rootElement包含整个xml文档的内容,也就是Response标签包含的所有内容

    2.2、获取Response节点的属性值

            //获取Response节点的Result属性值
            String responseResult = rootElement.attributeValue("Result");
    

    2.3、获取Media元素

            //获取第一个Media元素
            Element mediaElement = rootElement.element("Media");
            //获取所有的Media元素
            List allMeidaElements = rootElement.elements("Media");
    

    2.4、获取Media属性值

            //获取第一个Media元素的Name属性值
            String mediaName = mediaElement.attributeValue("Name");
            //遍历所有的Media元素的Name属性值
            for (int i = 0; i < allMeidaElements.size(); i++) {
                Element element = (Element) allMeidaElements.get(i);
                String name = element.attributeValue("Name");
            }
    

    2.5、获取Media标签的文本值

            //获取第一个Meida元素的文本值
            String value = mediaElement.getText();
    

    完整代码

    import java.io.File;
    import java.util.List;
    import org.dom4j.Document;
    import org.dom4j.DocumentException;
    import org.dom4j.Element;
    import org.dom4j.io.SAXReader;
    
    public class Textxml {
        public void xml() {
            SAXReader reader = new SAXReader();
            Document document = null;
            try {
                document = reader.read(new File("E:\\CZBK\\day01\\caseUp.xml"));
            } catch (DocumentException e) {
                e.printStackTrace();
            }
            //获取整个文档
            Element rootElement = document.getRootElement();
            System.out.println("整个文档:"+rootElement.asXML());
            
            //获取Response节点的Result属性值
            String responseResult = rootElement.attributeValue("Result");
            System.out.println("Response节点的Result属性值:"+responseResult);
            
            //获取第一个Media元素
            Element mediaElement = rootElement.element("Media");
            System.out.println("第一个Media元素:"+mediaElement.asXML());
            
            //获取所有的Media元素
            List allMeidaElements = rootElement.elements("Media");
            
            //获取第一个Media元素的Name属性值
            String mediaName = mediaElement.attributeValue("Name");
            System.out.println("第一个Media元素的Name属性值:"+mediaName);
            
            //遍历所有的Media元素的Name属性值
            for (int i = 0; i < allMeidaElements.size(); i++) {
                Element element = (Element) allMeidaElements.get(i);
                String name = element.attributeValue("Name");
            }
            
            //获取第一个Meida元素的文本值
            String value = mediaElement.getText();
            System.out.println("第一个Meida元素的文本值:"+value);
        }
    
        public static void main(String[] args) {
            Textxml textxml = new Textxml();
            textxml.xml();
        }
    }
    

    运行结果

    整个文档:<Response T="203" T1="6" TaskID="20130800001963" MediaNum="3" Result="1" Desc="查询成功!">
    <Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
        <Media Name="IMG_20130425_141838.jpg" Mediasource="2" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片2</Media>
        <Media Name="IMG_20130425_141838.jpg" Mediasource="3" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片3</Media>
    </Response>
    Response节点的Result属性值:1
    第一个Media元素:<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
    第一个Media元素的Name属性值:IMG_20130425_141838.jpg
    第一个Meida元素的文本值:图片1
    

    后记

    1、XML解析方式有很多中,未必每种都要掌握,把其中的一种解析弄清楚就够用了,至于性能上的差别楼主体会不出来,也不能解答这个问题

    2、DOM4J的API有很多,这篇文章中只是介绍了最基本的最常用的几种,如果有兴趣可以自行研究使用

    ps:如果文章有帮助到您,请点个赞,您的反馈会让我感到文章是有价值的

    相关文章

      网友评论

        本文标题:XML解析之DOM4J解析

        本文链接:https://www.haomeiwen.com/subject/naiqwttx.html