javasaxxml解析_java XML解析詳解

⑴ 目前在java中幾種常用的XML解析器的比較

目前常用的XML的解析器主要有:SAX,DOM,Xerces

1、SAX處理的優點非常類似於流媒體的優點。分析能夠立即開始，而不是等待所有的數據被處理。而且，由於應用程序只是在讀取數據時檢查數據，因此不需要將數據存儲在內存中。這對於大型文檔來說是個巨大的優點。事實上，應用程序甚至不必解析整個文檔；它可以在某個條件得到滿足時停止解析。一般來說，SAX還比它的替代者DOM快許多。另一方面，由於應用程序沒有以任何方式存儲數據，使用SAX來更改數據或在數據流中往後移是不可能的。

2、DOM以及廣義的基於樹的處理具有幾個優點。首先，由於樹在內存中是持久的，因此可以修改它以便應用程序能對數據和結構作出更改。它還可以在任何時候在樹中上下導航，而不是像SAX那樣是一次性的處理。DOM使用起來也要簡單得多。另一方面，在內存中構造這樣的樹涉及大量的開銷。大型文件完全佔用系統內存容量的情況並不鮮見。此外，創建一棵DOM樹可能是一個緩慢的過程。

3、選擇DOM還是選擇SAX，這取決於下面幾個因素:
應用程序的目的：如果打算對數據作出更改並將它輸出為XML，那麼在大多數情況下，DOM是適當的選擇。並不是說使用SAX就不能更改數據，但是該過程要復雜得多，因為您必須對數據的一份拷貝而不是對數據本身作出更改。
數據容量：對於大型文件，SAX是更好的選擇。數據將如何使用：如果只有數據中的少量部分會被使用，那麼使用SAX來將該部分數據提取到應用程序中可能更好。另一方面，如果您知道自己以後會回頭引用已處理過的大量信息，那麼SAX也許不是恰當的選擇。
對速度的需要：SAX實現通常要比DOM實現更快。
SAX和DOM不是相互排斥的，記住這點很重要。您可以使用DOM來創建SAX事件流，也可以使用SAX來創建DOM樹。事實上，用於創建DOM樹的大多數解析器實際上都使用SAX來完成這個任務！

4、SAX,DOM是兩種對XML文檔進行分析的方法（沒有具體的實現，只有介面），所以不是解釋器，如果光有他們，你是完成不了對xml文檔的處理的。SAX的包是org.xml.sax，DOM的包是org.w3c.dom，包的名稱很重要，它有助於你理解他們之間的關系。

5、jaxp是api，他封裝了sax/dom兩種介面。並在sax/dom的基礎之上，作了一套比較簡單的api以供開發人員使用。jaxp的包是javax.xml.parsers，可以看看jaxp的源文件，它的文件中包含了對sax或者dom的引用（import）jaxp也不是具體的實現，他只是一套api。如果你僅僅有jaxp那是無法工作的，（其實jaxp只是完成對sax、dom的包裝，生成了DocumentBuilderFactory/DocumentBuilder和SAXParserFactorySAXParser。也就是設計模式中的工廠模式，他的好處就是具體的對象（解釋器）建立由子類完成）

6、xerces解釋器（號稱地球上最快的xml解釋器）在xerces中對jaxp中定義的進行了繼承（extends）對應ryImpl這就是為什麼你的classpath中只要有xerces.jar（其中包含了saxdomjaxp）和xercesImpl.jar就可以的原因了.

⑵ java XML解析詳解

(I)Java通過DOM解析XML

1>得到DOM解析器的工廠實例
DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
得到javax.xml.parsers.DocumentBuilderFactory;類的實例就是我們要的解析器工廠

2>從DOM工廠獲得DOM解析器
DocumentBuilder dombuilder=domfac.newDocumentBuilder();
通過javax.xml.parsers.DocumentBuilderFactory實例的靜態方法newDocumentBuilder()得到DOM解析器

3>把要解析的XML文檔轉化為輸入流，以便DOM解析器解析它
InputStream is=new FileInputStream("bin/library.xml");
InputStream是一個介面。
4>解析XML文檔的輸入流，得到一個Document
Document doc=dombuilder.parse(is);
由XML文檔的輸入流得到一個org.w3c.dom.Document對象，以後的處理都是對Document對象進行的

5>得到XML文檔的根節點
Element root=doc.getDocumentElement();
在DOM中只有根節點是一個org.w3c.dom.Element對象。

6>得到節點的子節點
NodeList books=root.getChildNodes();
for(int i=0;i<books.getLength();i++){
Node book=books.item(i);
}
這是用一個org.w3c.dom.NodeList介面來存放它所有子節點的，還有一種輪循子節點的方法，後面有介紹

7>取得節點的屬性值
String email=book.getAttributes().getNamedItem("email").getNodeValue();
System.out.println(email);
注意，節點的屬性也是它的子節點。它的節點類型也是Node.ELEMENT_NODE

8>輪循子節點
for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()){

if(node.getNodeType()==Node.ELEMENT_NODE){

if(node.getNodeName().equals("name")){

String name=node.getNodeValue();

String name1=node.getFirstChild().getNodeValue();

...

if(node.getNodeName().equals("price")){

String price=node.getFirstChild().getNodeValue();
...

Java通過SAX解析XML
Simple API for XML（簡稱SAX）是個循序存取XML的解析器API。
一個實現SAX的解析器（也就是「SAX Parser」）以一個串流解析器的型式作用，擁有事件驅動API。由使用者定義回調函數，解析時，若發生事件的話會被調用。SAX事件包括：
XML 文字節點
XML 元素節點
XML 處理指令
XML 注釋

Java代碼
<person>
<user>
<username>謝成志</username>
<password>6626310xie</password>
<sex>男</sex>
<birthday>1988/11/28</birthday>
<headpic>
<pictitle>ermao</pictitle>
<picurl>images/head1.jpg</picurl>
</headpic>
</user>
</person>

此為下面即將解析度簡單xml結構，並將其封裝成一個User對象。

////////////////////////////////////////////////////////////////////////////////////

Java代碼
<span style="font-family: courier new,courier; font-size: small;">package com.xcz.xml;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

import com.xcz.util.SaxUtil;

public class Sax4XML {

public static void main(String[] args) {

try {
//1.獲取factory
SAXParserFactory factory = SAXParserFactory.newInstance();
//2.獲取parser
SAXParser parser = factory.newSAXParser();
//3.獲取解析時的監聽器對象
SaxUtil su = new SaxUtil();
//4.開始解析
parser.parse(new File("src/user-params.xml"), su);

System.out.println(su.getUser());

} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

}
}
</span>

////////////////////////////////////////////////////////////////////////////////////

Java代碼
<span style="font-family: courier new,courier; font-size: small;">package com.xcz.util;

import java.text.ParseException;
import java.text.SimpleDateFormat;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import com.xcz.po.HeadPic;
import com.xcz.po.User;

/**
* 定義xml解析時的監聽類
*
* 實現方式有很多，可以實現介面：ContentHandler，DTDHandler， EntityResolver 和 ErrorHandler
* 但我們常用的繼承：DefaultHandler
*/
public class SaxUtil extends DefaultHandler {

private User user;
private HeadPic headPic;
private String content;
private SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd");

@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
content = new String(ch, start, length);
}

//當解析到文本開始時觸發
@Override
public void startDocument() throws SAXException {
super.startDocument();
}

//當解析到文本結束時觸發
@Override
public void endDocument() throws SAXException {
super.endDocument();
}

//當解析到元素開始時觸發
@Override
public void startElement(String uri, String localName, String name,
Attributes attributes) throws SAXException
{
if("user".equals(name))
{
user = new User();
}
if("headpic".equals(name))
{
headPic = new HeadPic();
}
}

//當解析到元素結束時觸發
@Override
public void endElement(String uri, String localName, String name)
throws SAXException
{
if("username".equals(name))
{
user.setUsername(content);
}
if("password".equals(name))
{
user.setPassword(content);
}
if("sex".equals(name))
{
user.setSex(content);
}
if("birthday".equals(name))
{
try {
user.setBirthday(sdf.parse(content));
} catch (ParseException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
if("pictitle".equals(name))
{
headPic.setPicTitle(content);
}
if("picurl".equals(name))
{
headPic.setPicUrl(content);
user.setHeadPic(headPic);
}

}

public User getUser(){
return user;
}

}</span>

[優點]

(1).節約內存開銷

SAX解析器在某些方面優於DOM風格解析器，因為SAX解析器的內存使用量一般遠低於DOM解析器使用量。DOM解析器在任何處理開始之前，必須將xml以整棵樹放在內存，所以DOM解析器的內存使用量完全根據輸入資料的大小。相對來說，SAX解析器的內存內容，是只基於XML檔案的最大深度（XML樹的最大深度）和單一XML項目上XML屬性儲存的最大資料。

(2)解析速度快

因為SAX事件驅動的本質，處理文件通常會比DOM風格的解析器快。

[缺點]

SAX事件驅動的模型對於XML解析很有用，但它確實有某些缺點。

某些種類的XML驗證需要存取整份文件。例如，一個DTD IDREF屬性需要文件內有項目使用指定字串當成DTD ID屬性。要在SAX解析器內驗證，必須追蹤每個之前遇過的ID和IDREF屬性，檢查是否有任何相符。更甚者，一個IDREF找不到對應的ID，使用者只會在整份文件都解析完後才發現，若這種連結對於建立有效輸出是重要的，那用在處理整份文件的時間只是浪費。

⑶ 在java中解析xml有哪幾種方法

1、JDOM生成和解析XML
為減少DOM、SAX的編碼量,出現了JDOM
優點:20-80原則,極大減少了代鍵激碼量。
使用場合:要實現的功能簡單,如解析、創建等,但在底層,JDOM還是使用SAX(最常用)、DOM、Xanan文檔。
2、SAX生成和解析XML文檔
為解決DOM的問題,出現了SAX,SAX 事件驅動。當解析器發現元素開始、元素結束、文本、文檔的開始或結束等時發送事件,程序員編寫響應這些事件的代碼,保存數據。
優點:不用事先調入整個文檔,佔用資源少。SAX解析器代碼比DOM解析器代碼小,適於Applet下載。
缺點:不是持久的,事件過後若沒保存數據,那麼數據就握亮鋒丟了。無狀態性,從事件中只能得到文本,但不知該文本屬於哪個元素。
使用場合:Applet。只段晌需XML文檔的少量內容,很少回頭訪問,機器內存少。
3、DOM生成和解析XML文檔
為XML文檔的已解析版本定義了一組介面。解析器讀入整個文檔,然後構建一個駐留內存的樹結構,然後代碼就可以使用 DOM 介面來操作這個樹結構。
優點:整個文檔樹在內存中,便於操作,支持刪除、修改、重新排列等多種功能。
缺點:將整個文檔調入內存(包括無用的節點),浪費時間和空間。
使用場合:一旦解析了文檔還需多次訪問這些數據,硬體資源充足(內存、CPU)。
4、DOM4J生成和解析XML文檔
DOM4J
是一個非常非常優秀的Java XML
API,具有性能優異、功能強大和極端易用使用的特點,同時它也是一個開放源代碼的軟體。如今你可以看到越來越多的 Java 軟體都在使用 DOM4J
來讀寫 XML,特別值得一提的是連 Sun 的 JAXM 也在用 DOM4J。

導航:首頁 > 編程語言 > javasaxxml解析

javasaxxml解析

與javasaxxml解析相關的資料