java攻城狮之路--复习xml&dom_pull编程续

浏览数：30 / 时间：2015年06月08日

本章节我们要学习XML三种解析方式：

1、JAXP DOM 解析
2、JAXP SAX 解析
3、XML PULL 进行 STAX 解析

XML 技术主要企业应用
1、存储和传输数据
2、作为框架的配置文件

使用xml 存储和传输数据
1、通过程序生成xml
2、读取xml 中数据 ---- xml 解析

什么是DOM和SAX ？
DOM Document Object Model ----- 文档对象模型
DOM思想：将整个xml 加载内存中，形成文档对象，所有对xml操作都对内存中文档对象进行
DOM 是官方xml解析标准
* 所有开发语言都支持的

Java、JavaScript 都支持DOM

SAX Simple API for XML ----- XML 简单 API
程序员为什么发明sax解析方式？？当xml 文档非常大，不可能将xml所有数据加载到内存
SAX 思想：一边解析，一边处理，一边释放内存资源 ---- 不允许在内存中保留大规模xml 数据

StAX The Stream API for XML ----- XML 流 API
STAX 是一种拉模式 xml 解析方式，SAX 是一种推模式 XML 解析方式

推push模式：由服务器为主导，向客户端主动发送数据
拉pull模式: 由客户端为主导，主动向服务器申请数据

程序员在实际开发中，使用已经开发好工具包 ----- JAXP 、DOM4j 、XML PULL

解析方式与解析开发包关系？
解析方式是解析xml 思想，没有具体代码，解析开发包是解析xml思想具体代码实现

JAXP 是sun官方推出实现技术同时支持 DOM SAX STAX
DOM4j 是开源社区开源框架支持 DOM 解析方式
XML PULL Android 移动设备内置xml 解析技术支持 STAX 解析方式

当SAX和STAX 读取xml数据时，如果读取到内存数据不释放 ----- 内存中将存在整个xml文档数据
（类似DOM 支持修改和回写）。

DOM、SAX、STAX 在实际开发中选择？
在javaee日常开发中 ---- 优先使用DOM （编程简单）
当xml 文档数据非常多，不可能使用DOM ---造成内存溢出 ------ 优先使用STAX
移动开发使用 STAX ---- Android XML PULL

JAXP 开发进行 xml解析：
javax.xml.parsers 存放 DOM 和 SAX 解析器
javax.xml.stream 存放 STAX 解析相关类
org.w3c.dom 存放DOM解析时数据节点类
org.xml.sax 存放SAX解析相关工具类

DOM 解析快速入门
1、创建 xml 文档 books.xml
在企业实际开发中，为了简化xml 生成和解析 ---- xml 数据文件通常不使用约束的
2、使用DOM解析xml
将整个xml文档加载到内存中：工厂 --- 解析器 --- 解析加载
3、Document通过 getElementsByTagName 获得节点集合 NodeList
通过 NodeList 提供 getLength 和 item 遍历节点集合

遍历ArrayList
for (int i=0;i<arraylist.size();i++){
arraylist.get(i);
}

遍历NodeList
for (int i=0;i<nodelist.getLength();i++){
nodelist.item(i); ----- 将遍历每个节点转换子接口类型
}

什么是 Node? 对于xml 来说，xml所有数据都是node节点包括：
（元素节点、属性节点、文本节点、注释节点、CDATA节点、文档节点）。

Element Attr Text Comment CDATASection Document ----- 都是 Node 子接口

node有三个通用API ：
getNodeName()：返回节点的名称
getNodeType()：返回节点的类型
getNodeValue()：返回节点的值 ---- 所有元素节点value都是 null

------------------------------------------------------------------------------------
DOM 编程思路小结
1、装载XML文档 ---- Document
2、Document 获得指定元素 ----- getElementsByTagName （返回 NodeList）
3、遍历NodeList 获得每个 Node
4、将每个Node 强制转换 Element
5、通过元素节点API 操作属性和文本内容
getAttribute 获得属性值
getTextContent 获得元素内部文本内容

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book>
        <name>java编程思想</name>
        <price>88</price>
    </book>
    <book>
        <name>java编程高手</name>
        <price>99</price>
    </book>
</books>

books2.xml

package com.shellway.javase;

import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class demo1 {
      @Test
      public void getElement() throws ParserConfigurationException, SAXException, IOException{
          DocumentBuilderFactory douBuilderFactory = DocumentBuilderFactory.newInstance();
          DocumentBuilder documentBuilder =  douBuilderFactory.newDocumentBuilder();
          Document document = documentBuilder.parse("xml/books2.xml");
          //通过父节点获得相应书籍《java编程思想》图书的价格
          NodeList nodeList = document.getElementsByTagName("book");
          for (int i = 0; i < nodeList.getLength(); i++) {
            Element element = (Element) nodeList.item(i);
            Element element1 = (Element) element.getChildNodes().item(1);
            if (element1.getTextContent().equals("java编程思想")) {
                System.out.println(element.getChildNodes().item(3).getTextContent());
            }
        }
      }
      
      @Test
      public void getElement2() throws ParserConfigurationException, SAXException, IOException{
           DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
           DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
           Document document = documentBuilder.parse("xml/books2.xml");
           //通过兄弟节点获得相应书籍《java编程高手》的价格
           NodeList nodeList = document.getElementsByTagName("name");
           for (int i = 0; i < nodeList.getLength(); i++) {
              Element element = (Element) nodeList.item(i);
              if (element.getTextContent().equals("java编程高手")) {
                       String str =  element.getNextSibling().getNextSibling().getTextContent();
                       System.out.println(str);
            }
        }
     }
}

获得相应书籍《java编程高手》的价格

先用全局查找锁定范围，再用相对关系查找得到需要数据

getElementById 方法必须用于带有约束 xml文档中！！！！！！！

所以开发语言默认支持DTD，当使用Schema时，单独编程导入schema ！

XML DOM 增加、修改和删除操作 ------ 操作内存中文档对象

XML的回写

XML元素添加： 1、创建节点元素 2、将节点元素加入指定位置

XML元素修改：查询到指定元素 1、修改属性 setAttribute
2、修改元素文本内容 setTextContent

XML元素删除：删除节点.getParentNode().removeChild(删除节点)

--------------------------------------------------------------------------
SAX 和 STAX 都是基于事件驱动 ----- SAX推模式 STAX拉模式
SAX常用事件
startDocument() ---- 文档开始事件
startElemen() ---- 元素开始事件
characters() ---- 文本元素事件
endElement() ---- 元素结束事件
endDocument() ----- 文档结束事件

为什么说SAX是推模式解析？解析器控制xml文件解析，由解析器调用相应事件方法

在startElemen() endElement() 获得开始和结束元素名称
在characters() 获得读取到文本内容
在startElemen() 读取属性值

STAX 拉模式xml 解析方式 ----- 客户端程序，自己控制xml事件，主动调用相应事件方法

当使用XML PULL 如果使用Android系统，系统内置无需下载任何开发包，如果想JavaSE JavaEE
使用pull 解析技术下载单独pull 开发工具包。

xpp3 ----- XML Pull Parser 3 是pull API 代码实现

使用pull 解析器
1、去网站上下载 pull 解析器实现 xpp3 (Android 内置)
2、将 xpp3-1.1.3.4.C.jar 导入 java工程
导入jar包位于当前工程内部 , 在工程内新建 lib ，将jar复制过来，将pull 解析器 jar 添加build path

jar 包就是.class文件集合压缩包（采用zip格式压缩）

Pull解析器使用 stax 解析方式 ---- 拉模式解析
Pull采用将xml文档传递解析器，手动通过next触发文档解析事件，在客户端代码中获取当前事件，从而调用相应事件处理方法

3、创建pull 解析器
4、将xml 文档内容传递 pull 解析器

为什么 STAX 解析方式效率好于 SAX ？
1、SAX 无选择性的，所有事件都会处理解析方式，Stax 由用户控制需要处理事件类型
2、在使用Stax进行数据解析时，随时终止解析

Pull 解析器生成 xml 文档功能 ---- 通过 XmlSerializer 生成 xml 文档
解析xml ：文档开始、元素开始、文本元素、元素结束、文档结束
生成xml ：生成文档声明（文档开始），元素开始、文本内容、元素结束、文档结束
1、生成简单xml
2、通过对象数据生成xml
3、通过对象List数据生成xml

在程序中抽取两个方法 ----- 1. xml --- List对象 2. List对象生成xml

对内存中List进行CURD操作

作业：
1、整理 DOM 、SAX 、STAX 原理和区别
2、编写商品xml文件 --- 通过JAXP DOM 完成CURD操作
3、编写SAX运行案例 ----- 了解
4、编写商品XML文件 --- 通过Pull解析器完成 CURD操作 ---- 重点 xml2List list2xml 两个方法

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

java攻城狮之路--复习xml&dom_pull编程续