美文网首页Java开发
解析XML文件的方式(三)之SAX

解析XML文件的方式(三)之SAX

作者: 风中小酌 | 来源:发表于2020-02-02 16:59 被阅读0次

    SAX采用自顶向下逐行解析,解析效率比DOM快,内存占用小。

    0、要处理的XML文件

    <?xml version="1.0" encoding="UTF-8"?>
    <books xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
        <book id="1001">
            <name>JAVA 高级编程</name>
            <author>张三</author>
            <price>85.72</price>
        </book>
        <book id="1002">
            <name>C++和C#</name>
            <author>李失失</author>
            <price>125.73</price>
        </book>
    </books>
    

    1、创建DeaultHandler子类,用来解析XML文档

    import org.xml.sax.Attributes;
    import org.xml.sax.SAXException;
    import org.xml.sax.helpers.DefaultHandler;
    
    public class BookDefaultHandler extends DefaultHandler {
        /**
         * 解析xml文档时调用
         */
        public void startDocument() throws SAXException {
            System.out.println("开始解析XML文档");
            super.startDocument();
        }
    
        /**
         * 解析xml文档结束时调用
         */
        public void endDocument() throws SAXException {
            super.endDocument();
            System.out.println("完成解析XML文档");
        }
    
        /**
         * 解析XML文档节点开始时使用
         */
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
            super.startElement(uri, localName, qName, attributes);
        
            //判断如果是 book节点,获取节点属性和属性值
            if(qName.equals("book")){
                //获取当前属性的数量
                int len = attributes.getLength();
                //循环获取每个属性
                for(int i=0;i<len;i++){
                    //属性名称
                    String name = attributes.getQName(i);
                    //属性值
                    String value = attributes.getValue(i);
                    System.out.println("属性名称: " + name + "\t属性值: " + value);
                }
            }else if(!"books".equals(qName) && !"book".equals(qName)){
                System.out.print("节点的名称:" + qName + "\t");
            }
        }
    
        /**
         * 解析XML文档节点结束时使用
         */
        public void endElement(String uri, String localName, String qName) throws SAXException {
            super.endElement(uri, localName, qName);
        }
    
         /**
          * 解析节点文本内容
          */
        public void characters(char[] ch, int start, int length) throws SAXException {
            super.characters(ch, start, length);
            //将节点文本转为字符串
            String value = new String(ch, start, length);
            //排除空数据,并输出节点文本
            if(!"".equals(value.trim())){
                System.out.println(value);
            }
        }
    }
    

    2、SAX方式解析XML数据的步骤

    a. 创建SAXParserFactory对象
    b. 创建SAXParser对象(作为解析器)
    c. 创建DefaultHandler子类对象
    d. 调用parse方法

    import java.io.IOException;
    import javax.xml.parsers.ParserConfigurationException;
    import javax.xml.parsers.SAXParser;
    import javax.xml.parsers.SAXParserFactory;
    import org.xml.sax.SAXException;
    
    public class TestSax4Xml {
        public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
            //a. 创建SAXParserFactory对象
            SAXParserFactory spf = SAXParserFactory.newInstance();
            //b. 创建SAXParser对象(作为解析器)
            SAXParser sp = spf.newSAXParser();
            //c. 创建DefaultHandler子类对象
            BookDefaultHandler bdh = new BookDefaultHandler();
            //d. 调用SAXParser对象的parse方法
            sp.parse("book.xml", bdh);
        }
    }
    

    3、输出结果如下

    开始解析XML文档
    属性名称: id    属性值: 1001
    节点的名称:name  JAVA 高级编程
    节点的名称:author    张三
    节点的名称:price 85.72
    属性名称: id    属性值: 1002
    节点的名称:name  C++和C#
    节点的名称:author    李失失
    节点的名称:price 125.73
    完成解析XML文档

    相关文章

      网友评论

        本文标题:解析XML文件的方式(三)之SAX

        本文链接:https://www.haomeiwen.com/subject/wjdqxhtx.html