导航:首页 > 编程语言 > java解析xpath

java解析xpath

发布时间:2022-09-25 05:31:56

㈠ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

HttpEntity entity = redirectResponse.getEntity();
InputStream content = entity.getContent();
HtmlCleaner cleaner = new HtmlCleaner();
TagNode tagNode = cleaner.clean(content, "utf-8");
Object[] clickHrefs = tagNode.evaluateXPath("//div/a/@href");

if (clickHrefs != null) {
clickHref = clickHrefs[0].toString();
System.out.println("获取到跳转链接地址:" + clickHref);

}

㈡ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

使用jsoup可以做到,亲测可用。不仅可获得节点的xpath,还能获得该元素在css中的路径。

㈢ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

//htmlDcoument对象用来访问Html文档s
HtmlAgilityPack.HtmlDocument hd = new HtmlAgilityPack.HtmlDocument();
//加载Html文档
hd.LoadHtml(strhtml);
string str = hd.DocumentNode.SelectSingleNode("//*[@id='e_font']").OuterHtml;
这样就可以得到一个标签的HTml代码了

㈣ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

java中有解析html文档的库,直接网络或者google关键字:java html parser即可
不知道这些库是否能够获取页面元素对应的xpath值,这些库,仅供参考。但我想,这些库既然能够解析html文档,那么他们就一定会用到xpath,如果他们将xpath相关api暴漏出来的话,就能够实现你的功能啦。</ol>

㈤ java解析xml有几种方法

DOM(Document Object Model)解析
优点
允许应用程序对数据和结构做出更改
访问是双向的,可以在任何时候在树中上、下导航获取、操作任意部分的数据
缺点
解析XML文档的需要加载整个文档来构造层次结构,消耗内存资源大。
应用范围
遍历能力强,常应用于XML文档需要频繁改变的服务中。
解析步骤
创建一个 DocumentBuilderFactory 对象
创建一个 DocumentBuilder 对象
通过 DocumentBuilder 的 parse() 方法加载 XML 到当前工程目录下
通过 getElementsByTagName() 方法获取所有 XML 所有节点的集合
遍历所有节点
通过 item() 方法获取某个节点的属性
通过 getNodeName() 和 getNodeValue() 方法获取属性名和属性值
通过 getChildNodes() 方法获取子节点,并遍历所有子节点
通过 getNodeName() 和 getTextContent() 方法获取子节点名称和子节点值
package Paint;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DOMTest {
public static void main(String[] args) {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse("./src/Paint/hello.xml");
NodeList bookList = document.getElementsByTagName("book"); //节点集

int bookCnt = bookList.getLength();
System.err.println("一共获取到" + bookCnt +"本书");

for(int i=0; i Node book = bookList.item(i);
NamedNodeMap attrs = book.getAttributes();
for(int j=0; j Node attr = attrs.item(j);
System.err.println(attr.getNodeName()+"---"+attr.getNodeValue());//id

}

NodeList childNodes = book.getChildNodes();
for(int k=0; k if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE){
System.out.println(childNodes.item(k).getNodeName()+"---" + childNodes.item(k).getTextContent());
}
}
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}

SAX(Simple API for XML)解析
优点
不需要等待所有的数据被处理,解析就可以开始
只在读取数据时检查数据,不需要保存在内存中
可以在某一个条件满足时停止解析,不必要解析整个文档
效率和性能较高,能解析大于系统内存的文档
缺点
解析逻辑复杂,需要应用层自己负责逻辑处理,文档越复杂程序越复杂
单向导航,无法定位文档层次,很难同时同时访问同一文档的不同部分数据,不支持 XPath
解析步骤
获取一个 SAXParserFactory 的实例
通过 factory() 获取 SAXParser 实例
创建一个 handler() 对象
通过 parser 的 parse() 方法来解析 XML
SAXTest.java
package Paint;

import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

public class SAXTest {

public static void main(String[] args) {
// 获取实例
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
SAXParser parser = factory.newSAXParser();
SAXParserHandler handler = new SAXParserHandler();
parser.parse("./src/Paint/hello.xml", handler);

System.err.println("共有"+ handler.getBookList().size()+ "本书");
for(Book book : handler.getBookList()){
System.out.println(book.getName());
System.out.println("id=" + book.getId());
System.out.println(book.getAuthor());
System.out.println(book.getYear());
System.out.println(book.getPrice());
System.out.println(book.getLanguage());
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}

SAXParserHandler.java
package Paint;

import java.util.ArrayList;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {
String value = null;
Book book = null;
private ArrayList bookList = new ArrayList();

public ArrayList getBookList() {
return bookList;
}
/*
* XML 解析开始
*/
public void startDocument() throws SAXException {
super.startDocument();
System.out.println("xml 解析开始");
}

/*
* XML 解析结束
*/
public void endDocument() throws SAXException {
super.endDocument();
System.out.println("xml 解析结束");
}

/*
* 解析 XML 元素开始
*/
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {

super.startElement(uri, localName, qName, attributes);

if(qName.equals("book")){
book = new Book();

for(int i=0; i System.out.println(attributes.getQName(i)+"---"+attributes.getValue(i));
if(attributes.getQName(i).equals("id")){
book.setId(attributes.getValue(i));
}
}
}else if(!qName.equals("bookstore")){
System.out.print("节点名:"+ qName + "---");
}
}

/*
*解析 XML 元素结束
*/
public void endElement(String uri, String localName, String qName)
throws SAXException {

super.endElement(uri, localName, qName);
if(qName.equals("book")){
bookList.add(book);
book = null;
}
else if(qName.equals("name")){
book.setName(value);
}else if(qName.equals("year")){
book.setYear(value);
}else if(qName.equals("author")){
book.setAuthor(value);
}else if(qName.equals("price")){
book.setPrice(value);
}else if(qName.equals("language")){
book.setLanguage(value);
}
}

public void characters(char[] ch, int start, int length)
throws SAXException {
super.characters(ch, start, length);

// 获取节点值数组
value = new String(ch, start, length);
if(!value.trim().equals("")){
System.out.println("节点值:"+value);
}
}
}

㈥ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

不能。可以用servlet调用JSP页面来获取页面的数据。request.getAttrubite();用这点儿知识就可以了。

㈦ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

  1. java中有解析html文档的库,直接网络或者google关键字:java html parser即可

  2. 不知道这些库是否能够获取页面元素对应的xpath值,这些库,仅供参考。但我想,这些库既然能够解析html文档,那么他们就一定会用到xpath,如果他们将xpath相关api暴漏出来的话,就能够实现你的功能啦。

㈧ 能用java相关技术解析Html页面,批量获取页面内容对应的xpath吗

java有解析xml文件的第三方包,关于html还真不知道。
当然,不是说这个问题不可解,解决的方法是使用Java的正则表达式匹配对应的xpath即可,可以查看Java编程思想,查看对应的章节即可。

㈨ java xpath怎么解析string

假设要解析的字符串是 str:

InputStream iStream = new ByteArrayInputStream(str.getBytes());

Document dm = db.parse(iStream);

㈩ java解析xpath用什么好

用jdk自带的就行
Java 5 推出了 javax.xml.xpath 包,提供一个引擎和对象模型独立的 XPath 库。这个包也可用于 Java 1.3 及以后的版本,但需要单独安装 Java API for XML Processing (JAXP) 1.3。Xalan 2.7 和 Saxon 8 以及其他产品包含了这个库的实现。

阅读全文

与java解析xpath相关的资料

热点内容
穿搭技巧app卡色配什么颜色 浏览:589
程序员得结石 浏览:126
查公司薪资的app叫什么 浏览:407
压缩包多个文件夹图片连续看 浏览:480
linuxmysql无法用命令启动 浏览:439
地税身份认证用什么ApP 浏览:529
网址加密后能防止被封网吗 浏览:759
pic单片机项目 浏览:177
oppo手机忘记加密密码忘了怎么办 浏览:151
算法竞赛入门经典代码 浏览:155
多功能防盗加密锁闭阀 浏览:862
遥控灯单片机 浏览:815
网络时间同步算法 浏览:473
单片机p1口怎么检测 浏览:913
pdf高亮颜色 浏览:322
银行程序员的工资多少 浏览:19
服务器如何使用移动硬盘 浏览:533
pc饥荒为什么没有服务器 浏览:442
阿里云服务器地址是什么 浏览:148
如何戒除网瘾app 浏览:955