导航:首页 > 编程语言 > java正则匹配html

java正则匹配html

发布时间:2023-01-02 20:58:16

A. 如何使用java的正则表达式提取html标签

//我随便写了一个工具类,getRegexData就是那个方法,你可以根据你的需求稍加改动即可因为我使用的
//URL而不是HttpClient,所以数据是全部获取过来了,你自己改改吧!不懂再问我
packagecom.wdy.util;

importjava.io.IOException;
importjava.io.InputStream;
importjava.net.URL;
importjava.util.ArrayList;
importjava.util.List;
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;
/**
*工具类
*@authorWDY
*
*/
publicclassTool{
publicstaticvoidmain(String[]args){
System.out.println(getRegexData("<img[]*src.*?jpg"","<imgsrc="img1.jpg"><imgsrc="img2.jpg""));


try{
URLurl=newURL("http://www..com");
StringstringData=getStringFromInputStream(url.openStream());
System.out.println(stringData+"----------------------------------------");
System.out.println();

System.out.println(getRegexData("http://.{6,70}?(png|jpg)",stringData));
}catch(IOExceptione){
e.printStackTrace();
}
}
/**
*给一个正则表达式,和数据,将正则匹配到的数据全数取出来
*
*@paramregex
*@paramdata
*@returnList<String>
*/
publicstaticList<String>getRegexData(Stringregex,Stringdata){
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(data);
List<String>resultList=newArrayList<String>();
intindex=0;//搜索的位置
Stringtemp="";
/*从指定位置查找,如果找到了,就继续执行下面的代码*/
while(matcher.find(index)){
temp=matcher.group();//将匹配到的数据取出来放到集合中去
resultList.add(temp);
index+=temp.length();//将查找位置放到此时找到的数据后面
System.out.println(index);
}
returnresultList;
}
/**
*将输入流装成字符串
*@paramis
*@return
*/
(InputStreamis)throwsIOException{

StringBuildersbl=newStringBuilder();
byte[]buff=newbyte[1024*8];
intlen;
inti=0;
while((len=is.read(buff))!=-1){
sbl.append(newString(buff,0,len,"utf-8"));
System.out.println(i++);
}
System.out.println(sbl.length());
returnsbl.toString();
}
}

B. java正则表达式替换html中除标签外的关键字内容

\b{keywords}\b(?=[^<>]*<)
把上面{keywords}替换成你的关键字,注意把{}也替换掉,我是为了让你看明白换哪才加的{}。
然后你找到匹配上面的正则的地方后替换成你想替换的字符串就好了,全部替换记得用全局修饰符

C. java 正则表达式是什么

不同情况下的正则表达式:

阅读全文

与java正则匹配html相关的资料

热点内容
程序员打代码最佳时间 浏览:569
怎么装原生态安卓 浏览:847
工程图学pdf 浏览:398
开放的程序员 浏览:952
胡希恕伤寒论讲座pdf 浏览:766
aspnet程序员薪水 浏览:76
苹果为什么屏幕看得比安卓舒服 浏览:119
苹果数据线怎么转安卓 浏览:656
黑格尔pdf下载 浏览:959
备忘录里新建文件夹怎么删除 浏览:12
服务器黑名单怎么处理 浏览:842
程序员电视剧25集 浏览:214
80351单片机 浏览:958
advancedwifi源码 浏览:577
maczip解压成文件夹后怎么打开 浏览:120
androidapp内存大小 浏览:451
程序员干私活网站 浏览:379
未来软件加密锁驱动 浏览:930
美军如何拒绝执行上级命令 浏览:489
布鲁诺pdf 浏览:163