⑴ java的xml的解析方式有什么,他们的解析流程是怎么样的,有什么区别
答:4种。(或者说是两种,因为JDOM和DOM4J是DOM的两个特殊情况)
1.SAX解析
解析方式是事件驱动机制!
SAX解析器,逐行读取XML文件解析,每当解析到一个标签的开始/结束/内容/属性时,触发事件。
可以在这些事件发生时,编写程序进行相应的处理。
优点:
分析能够立即开始,而不是等待所有的数据被处理。
逐行加载,节省内存,有助于解析大于系统内存的文档。
有时不必解析整个文档,它可以在某个条件得到满足时停止解析。
缺点:
1.单向解析,无法定位文档层次,无法同时访问同一个文档的不同部分数据(因为逐行解析,当解析第n行时,第n-1行)已经被释放了,无法再对其进行操作)。
2. 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系。
3. 只读解析方式, 无法修改XML文档的内容。
2. DOM解析
是用与平台和语言无关的方式表示XML文档的官方W3C标准,分析该结构通常需要加载整个 文档和内存中建立文档树模型。程序员可以通过操作文档树, 来完成数据的获取 修改 删除等。
优点:
文档在内存中加载, 允许对数据和结构做出更改。访问是双向的,可以在任何时候在树中双向解析数据。
缺点:
文档全部加载在内存中 , 消耗资源大。
3. JDOM解析
目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。由于是第一 个Java特定模型,JDOM一直得到大力推广和促进。
JDOM文档声明其目的是“使用20%(或更少)的精力解决80%(或更多)Java/XML问题” (根据学习曲线假定为20%)
优点:
使用具体类而不是接口,简化了DOM的API。
大量使用了Java集合类,方便了Java开发人员。
缺点:
没有较好的灵活性。
性能不是那么优异。
4. DOM4J解析
它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项, DOM4J是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一 个开放源代码的软件。如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML。
目前许多开源项目中大量采用DOM4J , 例如:Hibernate。
⑵ Java如何读取XML文件 具体实现
xml的解析
1.解析式为了得到里面的内容,进行增,删,改查的操作
XML的解析方式
SAX(Simple API for XML)xml文档的一种简单的解析方式
DOM(Document Object Model)
DOM4J
SAX:基于事件的解析方式
DOM: 基于对象的解析方式
事件监听三要素
1.事件源
2.监听器
3.事件
SAX 基于事件的解析
优点: 简单 效率高
缺点:顺序执行,不能得到某个元素 不能逆向执行
不能进行增,与删的操作
SAX解析方式工作原理:
通过时间源xml文档创建SAXParseFactory
SAXParserFactory factory=SAXParserFactory.newInstance();
得到一个解析器
SAXParser parse=factory.newSAXParser();
对xml文件进行解析
得到解析的文件对象
File file=new File("employees.xml");
通过监听器进行解析
MyListener listener=new MyListener();
parse.parse(file,listener);
对于监听器有5个方法:监听器所在的类实现的接口有:
org.xml.sax.hepers.DefaultHandler
org.xml.sax
通过查看API文档中的DefaultHandler类中的下面5个方法
startDocument() 对于文档开始的解析
public void startDocument()throws SAXException{
System.out.println("文档开始解析啦!!!!");
}
startElement()元素开始的解析其中几个名词
url:命名空间的url
localName:命名空间的前缀
qName:元素
attributes:元素里的属性
public void startElement(String url,String localName,String qName,Attributes attributes)throws SAXException{
StringBuffer sb=new StringBuffer();
sb.append("<"+qName);
for(int i=0;i<attributes.getLength();i++){
String attName=attributes.getQName(i);获得元素属性名称其中的i为元素的第几个属性
String attValue=attributes.getValue(i);获得元素属性的值其中的i为元素的第几个属性的值
sb.append(attName+"="+attValue);
}
sb.append(">");
System.out.print(sb.toString());
}
character()获得元素的内容体
public void characters(char[]ch,int start,int length)throws SAXException{
System.out.print(new String(ch,start,length));
}
endElement()获得元素的结束事件
public void endElement(String url,String localName,String qName)throws SAXException{
System.out.print("</"+qName+">");
}
endDocument()获得文档的结束事件
public void endDocument(){
System.out.println("文档解析结束啦!!!!");
}
对于SAX解析只能逐行解析不能越行解析
DOM:基于对象的
优点:灵活,能进行增删的操作
缺点:读取速度慢,效率低 占用的内容多
对于DOM解析:不需要添加监听器,按级解析从根元素、一级子元素、二级子元素......
同SAX解析相同刚开始也是要得到一个解析器;
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;
因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象
DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器
对于document可以有两种方法得到:
Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档
Document document=builder.newDocument();可以得到一个空的document对象
得到根节点
Element root=document.getDocumentElement();
如果不存在根节点即为一个空document对象的时候只能添加跟节点
Element root=document.createElement(根节点的名字)
得到根节点下面的所有一级子元素
NodeList list=root.getElementsByTagName(根节点的名字可以用root.getTagName或者root.getNodeName()得到根节点的名字)();
{
对与document可以添加一级子元素
不管document是否为空都可以添加
Element firstElements =root.creatElement(一级子元素的名字);
当然也可以为一级子元素添加属性
一级子元素的名字.setAttribute("属性名","属性值");
}
通过遍历list集合
for(int i=0;i<list.getLength();i++){
Element first_elements=(Element)list.item(i);
可以得到一级资源的属性的值当知道属性的时候
String attribute=first_elements.getAttribute("属性的名字");
得到一级子元素的名字
String first_elements_name=first_elements.getNodeName();
得到一级子元素下面所有的元素如id 第一个id元素当然也可有很多个id
通过item()来确定要取那个id
Element id_element=(Element)first_elements.getElementByName("id").item(0);
得到id的值
String id_value=id_element.getFirstChild().getTextContent();
通过这个遍历集合可以拿到所有子元素
}
DOM添加或删除元素:
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;
因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象
DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器
对于document可以有两种方法得到:
Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档
Document document=builder.newDocument();可以得到一个空的document对象
得到根节点
Element root=document.getDocumentElement();
如果不存在根节点即为一个空document对象的时候只能添加跟节点
Element root=document.createElement(根节点的名字)
对与document可以添加一级子元素
不管document是否为空都可以添加
Element firstElements =root.creatElement(一级子元素的名字);
当然也可以为一级子元素添加属性
一级子元素的名字.setAttribute("属性名","属性值");
添加二级子元素
Element secondElements=firstElements.creatElement("二级子元素的名字");
挂载组装
一级子元素firstElements.append(secondElements);
根节点root.appendChild(firstElements);
将document对象树写入磁盘
TransformerFactory tf=TransformerFactory.newInstance();
Transformer former=tf.newTransformer();
DOMSource source=new DOMSource(document);
StreamResult result= new StreamResult(new File("10.xml"));结果集
former.transform(source,result);
完毕
DOM4j需要借助外部jar包
需要借助外部jar包就必须设置环境变量中的classpath把classpath设置成
dom4j jar包存在的路径(绝对路径)
例如:
set classpath=.;C:\Documents and Settings\Administrator\桌面\day3\dom4j.jar
import org.dom4j.io.*;
import java.io.*;
import java.util.*;
import org.dom4j.*;
public static void read_XML(String fileName){
try{
//得到一个解析器,相当于SAX,DOM里面的解析器工厂,与解析器
SAXReader reader=new SAXReader();
//得到一个对象树
Document document=reader.read(new File(fileName));
//得到一个根元素
Element root=document.getRootElement();
System.out.println(root.getName());
//得到所有的一级子元素
List firstElements=root.elements();
Iterator it=firstElements.iterator();
while(it.hasNext()){
//依次得到每一个一级子元素
Element firstElement=(Element)it.next();
System.out.println(firstElement.getName());
//得到所有的属性
List attributes=firstElement.attributes();
for(Object obj:attributes){
//依次得到每一个属性
Attribute att=(Attribute)obj;
System.out.println(att.getName()+"="+att.getValue());
}
//得到一级子元素下面的所有元素,及其附带值
List second_Elements=firstElement.elements();
Iterator second_Element=second_Elements.iterator();
while(second_Element.hasNext()){
Element sec_Element=(Element)second_Element.next();
System.out.println(sec_Element.getName()+":"+sec_Element.getText());
}
System.out.println("----------");
}
}catch(Exception e){
}
}
public static void write(String fileName){
try{
Document document = DocumentHelper.createDocument();
//创造一级子元素
Element books=document.addElement("books");
books.addComment("The book is J2EE");
Element book=books.addElement("book");
创建元素的属性
book.addAttribute("show","yes");
book.addAttribute("page","100");
创建二级子元素
Element book_name=book.addElement("bookName");
创建元素的内容体
book_name.setText("xml");
Element book_price=book.addElement("bookPrice");
book_price.setText("3000");
Element book_press=book.addElement("bookPress");
book_press.setText("etoak");
Element book_author=book.addElement("bookAuthor");
book_author.setText("Robin");
//挂载另一个一级子元素
book=books.addElement("book");
book.addAttribute("show","NO");
book.addAttribute("page","200");
book_name=book.addElement("bookName");
book_name.setText("葵花宝典");
book_price=book.addElement("bookPrice");
book_price.setText("无价之宝");
book_press.addElement("bookPress");
book_press.setText("华山派");
book_author=book.addElement("bookAuthor");
book_author.setText("林平之");
//创建xml文件输出的路径
OutputFormat format=OutputFormat.createPrettyPrint();
format.setEncoding("gbk");
XMLWriter xw=new XMLWriter(new FileOutputStream(fileName),
format);
//XMLWriter xx= new XMLWriter(System.out,OutputFormat.createPrettyPrint());
xw.write(document);
xw.flush();
xw.close();
}catch(Exception e){
对于DOM4j添加子元素,是一级一级的添加的而在DOM中是先创造
子元素然后再挂载的DOM4j在创建子元素的时候就确定好了顺序
对于文件的输出各有千秋各有特色其中SAX是需要添加监听器的
}
}
public static void update(String fileName){
try{
SAXReader reader= new SAXReader();
Document document = reader.read(new File(fileName));
Element root = document.getRootElement();
System.out.println(root.getName());
在根节点上添加一级子元素
Element student=root.addElement("student");
Element id=student.addElement("id");
id.setText("007");
OutputStream os= new FileOutputStream(fileName);
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xw = new XMLWriter(os,format);
xw.write(document);
xw.flush();
xw.close();
}catch(Exception e){
和创建一个新的document对象类似只不过这个的根节点已经存在
直接可以在根节点上添加一级子元素;
}
}
⑶ java如何读取xml文件
// 读取输入流
SAXReader reader = new SAXReader();
Document document = reader.read(inputStream);
// 得到xml根元素
Element root = document.getRootElement();
// 得到根元素的所有子节点
List<Element> elementList = root.elements();
// 遍历所有子节点
for (Element e : elementList)
map.put(e.getName(), e.getText());
// 释放资源
inputStream.close();
inputStream = null;
参考http://blog.csdn.net/lyq8479/article/details/8949088
⑷ java XML创建 Element 转为字符串,如果节点为空 则会变成<TrainNo/> 可以改为<TrainNo></TrainNo>吗
这个没必要改吧,<TrainNo/>这种方式在XML中表示空元素,不影响被解析。
⑸ 如何用java生成一个xml文件
一个XML文档,可以先构造一个DOM,然后将DOM转化为xml序列,输出或者生成文件。package test;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
public class Test {
public static void generate(){
try {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.newDocument();
document.setXmlVersion("1.0");
document.setXmlStandalone(true);
Element root = document.createElement_x("MobileNet"); //创建根节点
document.appendChild(root); //将根节点添加到Document对象中
Element pageElement = document.createElement_x("page"); //设置第一个page元素到
pageElement.setAttribute("name", "list.jsp"); //设置page节点的name属性
Element methodElement = document.createElement_x("method"); //设置method节点
methodElement.setTextContent("get"); //给method设置值
pageElement.appendChild(methodElement); //添加method节点到page节点内
Element displayElement = document.createElement_x("display"); //设置method节点
displayElement.setTextContent("list撒旦发放"); //给display设置值
pageElement.appendChild(displayElement); //添加display节点到page节点内
Element request_paramElement = document.createElement_x("request_param");
request_paramElement.setTextContent("request_param1|request_param2");
pageElement.appendChild(request_paramElement);
root.appendChild(pageElement);
pageElement = document.createElement_x("page"); //设置第二个page元素到
pageElement.setAttribute("name", "content.jsp"); //设置page节点的name属性
methodElement = document.createElement_x("method");
methodElement.setTextContent("post");
pageElement.appendChild(methodElement);
displayElement = document.createElement_x("display");
displayElement.setTextContent("content");
pageElement.appendChild(displayElement);
Element url_titleElement = document.createElement_x("url_title"); //设置url_title节点
url_titleElement.setTextContent("title,publisher,published_calendar"); //给url_title设置值
pageElement.appendChild(url_titleElement); //添加url_title节点到page节点内
root.appendChild(pageElement); //将page段加人根节点内
TransformerFactory transFactory = TransformerFactory.newInstance(); //开始把Document映射到文件
Transformer transFormer = transFactory.newTransformer();
DOMSource domSource = new DOMSource(document); //设置输出结果
File file = new File("MobileNetRule.xml"); //生成xml文件
if (!file.exists()) {
file.createNewFile();
}
FileOutputStream out = new FileOutputStream(file); //文件输出流
StreamResult xmlResult = new StreamResult(out); //设置输入源
transFormer.transform(domSource, xmlResult); //输出xml文件
System.out.println(file.getAbsolutePath()); //测试文件输出的路径
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
t.setOutputProperty("{/encoding/}","GB2312/");
ByteArrayOutputStream boc = new ByteArrayOutputStream();
t.transform(new DOMSource(document), new StreamResult(boc));
String xmlstring = boc.toString();
System.out.println(xmlstring);
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main(String[] args){
Test.generate();
}
}