javaxml解析sax_java的xml的解析方式有什么他们的解析流程是怎么样的有什么区别

❶ 目前在java中几种常用的XML解析器的比较

目前常用的XML的解析器主要有:SAX,DOM,Xerces

1、SAX处理的优点非常类似于流媒体的优点。分析能够立即开始，而不是等待所有的数据被处理。而且，由于应用程序只是在读取数据时检查数据，因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上，应用程序甚至不必解析整个文档；它可以在某个条件得到满足时停止解析。一般来说，SAX还比它的替代者DOM快许多。另一方面，由于应用程序没有以任何方式存储数据，使用SAX来更改数据或在数据流中往后移是不可能的。

2、DOM以及广义的基于树的处理具有几个优点。首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航，而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。另一方面，在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外，创建一棵DOM树可能是一个缓慢的过程。

3、选择DOM还是选择SAX，这取决于下面几个因素:
应用程序的目的：如果打算对数据作出更改并将它输出为XML，那么在大多数情况下，DOM是适当的选择。并不是说使用SAX就不能更改数据，但是该过程要复杂得多，因为您必须对数据的一份拷贝而不是对数据本身作出更改。
数据容量：对于大型文件，SAX是更好的选择。数据将如何使用：如果只有数据中的少量部分会被使用，那么使用SAX来将该部分数据提取到应用程序中可能更好。另一方面，如果您知道自己以后会回头引用已处理过的大量信息，那么SAX也许不是恰当的选择。
对速度的需要：SAX实现通常要比DOM实现更快。
SAX和DOM不是相互排斥的，记住这点很重要。您可以使用DOM来创建SAX事件流，也可以使用SAX来创建DOM树。事实上，用于创建DOM树的大多数解析器实际上都使用SAX来完成这个任务！

4、SAX,DOM是两种对XML文档进行分析的方法（没有具体的实现，只有接口），所以不是解释器，如果光有他们，你是完成不了对xml文档的处理的。SAX的包是org.xml.sax，DOM的包是org.w3c.dom，包的名称很重要，它有助于你理解他们之间的关系。

5、jaxp是api，他封装了sax/dom两种接口。并在sax/dom的基础之上，作了一套比较简单的api以供开发人员使用。jaxp的包是javax.xml.parsers，可以看看jaxp的源文件，它的文件中包含了对sax或者dom的引用（import）jaxp也不是具体的实现，他只是一套api。如果你仅仅有jaxp那是无法工作的，（其实jaxp只是完成对sax、dom的包装，生成了DocumentBuilderFactory/DocumentBuilder和SAXParserFactorySAXParser。也就是设计模式中的工厂模式，他的好处就是具体的对象（解释器）建立由子类完成）

6、xerces解释器（号称地球上最快的xml解释器）在xerces中对jaxp中定义的进行了继承（extends）对应ryImpl这就是为什么你的classpath中只要有xerces.jar（其中包含了saxdomjaxp）和xercesImpl.jar就可以的原因了.

❷ JAVA技术:XML配置文件的读取处理

Java和XML是黄金组合，网上已经有很多文章介绍，XML作为电子商务中数据交换，已经有其不可替代的作用，但是在平时系统开发中，我们不一定都用到数据交换，是不是无法使用XML了？
当然不是，现在已经有一个新趋势，java程序的配置文件都开始使用XML格式，以前是使用类似windows的INI格式。（Java中也有Propertiesy这样的类专门处理这样的属性配置文件）。使用XML作为Java的配置文件有很多好处，从Tomcat的安装配置文件和J2ee的配置文件中，我们已经看到XML的普遍应用，让我们也跟随流行趋旦饥势用XML武装起来。
现在关键是如何读取XML配置模余返文件？有好几种XML解析器：主要有DOM和SAX ，这些区别网上文章介绍很多。
在apache的XML项目组中，目前有Xerces Xalan Cocoon几个开毁让发XML相关技术的project.Tomcat本身使用的是 Sun 的 JAXP，而其XSL Taglib project中使用Xerces解析器。
好了，上面都是比较烦人的理论问题，还是赶快切入XML的配置文件的读取吧。
在我们的程序中，通常要有一些根据主机环境确定的变量。比如数据库访问用户名和密码，不同的主机可能设置不一样。只要更改XML配置文件，就可以正常运行。
localhost
sqlname
username
password
上面这个myenv.xml配置文件一般是放在tomcat的WEB-INF/classes目录下。
我们编制一个Java程序直接读取，将dbhost dbuser dbpassword提取出来供其他程序访问数据库用。
目前使用SAX比较的多，与DOM主要区别是 SAX是一行一行读取XML文件进行分析，适合比较大文件，DOM是一次性读入内存，显然不能对付大文件。这里我们使用SAX解析，由于SAX解析器不断在发展，网上有不少文章是针对老版本的。如果你使用JDK1.4 ，可以参考使用SAX处理XML文档一文。这里的程序是根据其改进并且经过实践调试得来的。
对上面myenv.xml读取的Java程序：
import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.SAXException;
import java.util.Properties;
//使用DefaultHandler的好处是不必陈列出所有方法,
public class ConfigParser extends DefaultHandler {
////定义一个Properties 用来存放 dbhost dbuser dbpassword的值
private Properties props;
private String currentSet;
private String currentName;
private StringBuffer currentValue = new StringBuffer();
//构建器初始化props
public ConfigParser() {
this.props = new Properties();
}
public Properties getProps() {
return this.props;
}
//定义开始解析元素的方法. 这里是将中的名称xxx提取出来.
public void startElement(String uri, String localName, String qName, Attributes attributes)
throws SAXException {
currentValue.delete(0, currentValue.length());
this.currentName =qName;
}
//这里是将之间的值加入到currentValue
public void characters(char[] ch, int start, int length) throws SAXException {
currentValue.append(ch, start, length);
}
//在遇到结束后,将之前的名称和值一一对应保存在props中
public void endElement(String uri, String localName, String qName) throws SAXException {
props.put(qName.toLowerCase(), currentValue.toString().trim());
}
}
上面的这个解析程序比较简单吧？其实解析XML就是这么简单。
现在我们已经将dbhost dbuser dbpassword的值localhost sqlname username password提取了出来。但是这只是在在解析器内部，我们的程序还不能访问。需要再编制一个程序。
import java.util.Properties;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import .URL;
public class ParseXML{
//定义一个Properties 用来存放 dbhost dbuser dbpassword的值
private Properties props;
//这里的props
public Properties getProps() {
return this.props;
}
public void parse(String filename) throws Exception {
//将我们的解析器对象化
ConfigParser handler = new ConfigParser();
//获取SAX工厂对象
SAXParserFactory factory = SAXParserFactory.newInstance();
factory.setNamespaceAware(false);
factory.setValidating(false);
//获取SAX解析
SAXParser parser = factory.newSAXParser();
//得到配置文件myenv.xml所在目录. tomcat中是在WEB-INF/classes
//下例中BeansConstants是用来存放xml文件中配置信息的类,可以自己代替或定义
URL confURL = BeansConstants.class.getClassLoader().getResource(filename);
try
{
//将解析器和解析对象myenv.xml联系起来,开始解析
parser.parse(confURL.toString(), handler);
//获取解析成功后的属性以后我们其他应用程序只要调用本程序的props就可以提取出属性名称和值了
props = handler.getProps();
}finally{
factory=null;
parser=null;
handler=null;
}
}
}
由于我们的XML文件是使用最简单的形式，因此解析器相对简单，但是这已经足够对付我们的配置文件了。

❸ java的xml的解析方式有什么，他们的解析流程是怎么样的，有什么区别

答：4种。（或者说是两种，因为JDOM和DOM4J是DOM的两个特殊情况）

1.SAX解析
解析方式是事件驱动机制！

SAX解析器，逐行读取XML文件解析，每当解析到一个标签的开始/结束/内容/属性时，触发事件。

可以在这些事件发生时，编写程序进行相应的处理。

优点：

分析能够立即开始，而不是等待所有的数据被处理。

逐行加载，节省内存，有助于解析大于系统内存的文档。

有时不必解析整个文档，它可以在某个条件得到满足时停止解析。

缺点：

1.单向解析，无法定位文档层次，无法同时访问同一个文档的不同部分数据（因为逐行解析，当解析第n行时，第n-1行）已经被释放了，无法再对其进行操作）。

2. 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系。

3. 只读解析方式, 无法修改XML文档的内容。

2. DOM解析
是用与平台和语言无关的方式表示XML文档的官方W3C标准，分析该结构通常需要加载整个文档和内存中建立文档树模型。程序员可以通过操作文档树, 来完成数据的获取修改删除等。

优点:

文档在内存中加载, 允许对数据和结构做出更改。访问是双向的，可以在任何时候在树中双向解析数据。

缺点:

文档全部加载在内存中 , 消耗资源大。

3. JDOM解析
目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和促进。

JDOM文档声明其目的是“使用20%（或更少）的精力解决80%（或更多）Java/XML问题” （根据学习曲线假定为20%）

优点:

使用具体类而不是接口，简化了DOM的API。

大量使用了Java集合类，方便了Java开发人员。

缺点:

没有较好的灵活性。

性能不是那么优异。

4. DOM4J解析
它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项， DOM4J是一个非常优秀的Java XML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML。

目前许多开源项目中大量采用DOM4J , 例如:Hibernate。

导航:首页 > 编程语言 > javaxml解析sax

javaxml解析sax

与javaxml解析sax相关的资料