javaif正則表達式_JAVA正則表達式

1. 請問java中正則表達式匹配怎麼實現的!

Java中正則表達式匹配的語法規則：

packageorg.luosijin.test;
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

/**
*正則表達式
*@versionV5.0
*@authorAdmin
*@date2015-7-25
*/
publicclassRegex{

/**
*@paramargs
*@authorAdmin
*@date2015-7-25
*/

publicstaticvoidmain(String[]args){
Patternpattern=Pattern.compile("b*g");
Matchermatcher=pattern.matcher("bbg");
System.out.println(matcher.matches());
System.out.println(pattern.matches("b*g","bbg"));
//驗證郵政編碼
System.out.println(pattern.matches("[0-9]{6}","200038"));
System.out.println(pattern.matches("//d{6}","200038"));
//驗證電話號碼
System.out.println(pattern.matches("[0-9]{3,4}//-?[0-9]+","02178989799"));
getDate("Nov10,2009");
charReplace();
//驗證身份證:判斷一個字元串是不是身份證號碼，即是否是15或18位數字。
System.out.println(pattern.matches("^//d{15}|//d{18}$","123456789009876"));
getString("D:/dir1/test.txt");
getChinese("welcometochina,江西奉新,welcome,你!");
validateEmail("[email protected]");
}
/**
*日期提取:提取出月份來
*@paramstr
*@authorAdmin
*@date2015-7-25
*/
publicstaticvoidgetDate(Stringstr){
StringregEx="([a-zA-Z]+)|//s+[0-9]{1,2},//s*[0-9]{4}";
Patternpattern=Pattern.compile(regEx);
Matchermatcher=pattern.matcher(str);
if(!matcher.find()){
System.out.println("日期格式錯誤!");
return;
}
System.out.println(matcher.group(1));//分組的索引值是從1開始的，所以取第一個分組的方法是m.group(1)而不是m.group(0)。
}
/**
*字元替換:本實例為將一個字元串中所有包含一個或多個連續的「a」的地方都替換成「A」。
*
*@authorAdmin
*@date2015-7-25
*/
publicstaticvoidcharReplace(){
Stringregex="a+";
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher("okaaaaLetmeAseeaaaaabooa");
Strings=matcher.replaceAll("A");
System.out.println(s);
}
/**
*字元串提取
*@paramstr
*@authorAdmin
*@date2015-7-25
*/
publicstaticvoidgetString(Stringstr){
Stringregex=".+/(.+)$";
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(str);
if(!matcher.find()){
System.out.println("文件路徑格式不正確！");
return;
}
System.out.println(matcher.group(1));
}
/**
*中文提取
*@paramstr
*@authorAdmin
*@date2015-7-25
*/
publicstaticvoidgetChinese(Stringstr){
Stringregex="[//u4E00-//u9FFF]+";//[//u4E00-//u9FFF]為漢字
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(str);
StringBuffersb=newStringBuffer();
while(matcher.find()){
sb.append(matcher.group());
}
System.out.println(sb);
}
/**
*驗證Email
*@paramemail
*@authorAdmin
*@date2015-7-25
*/
publicstaticvoidvalidateEmail(Stringemail){
Stringregex="[0-9a-zA-Z]+@[0-9a-zA-Z]+//.[0-9a-zA-Z]+";
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(email);
if(matcher.matches()){
System.out.println("這是合法的Email");
}else{
System.out.println("這是非法的Email");
}
}
}

2. Java中怎麼簡單的使用正則表達式

一個正則表達式就是由普通字元(例如大小寫字母)以及特殊字元(稱為元字元)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字元串。正則表達式作為一個模板，將某個字元模式與所搜索的字元串進行匹配。

在最簡單的情況下，一個正則表達式看上去就是一個普通的查找串。例如，正則表達式"java"中沒有包含任何元字元，它可以匹配"java"和"javascript"等字元串，但是不能匹配"Java"。

正則表達式不僅能進行字元串的匹配，還能進行字元串的提取、替換。

示例代碼：

String regEx = ".+/(.+)$";

String str = "D:/java/test.txt";

Pattern p = Pattern.compile(regEx);

Matcher m = p.matcher(str);

if (!m.find()){

System.out.println("文件路徑格式錯誤!");

return;

}

System.out.println(m.group(1));

運行結果：test.txt

正則表達式「.+/(.+)$」的含義就是：被匹配的字元串以任意字元序列開始，後邊緊跟著字元「/」，最後以任意字元序列結尾，「()」代表分組操作，這里就是把文件名做為分組，匹配完畢就可以通過Matcher 類的group方法取到所定義的分組了。需要注意的這里的分組的索引值是從1開始的，所以取第一個分組的方法是m.group(1)而不是m.group(0)。

3. java中正則表達式如何使用比如判斷一個字元串是否滿足某種格式,給個詳細點的例子

按照你的要求給出的Java正則表達式的例子如下

//下面這個正則表達式匹配不能以.css,.html,.js,.json或者.xml結尾的字元串
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;
publicclassCC{
publicstaticvoidmain(String[]args){
Strings="xxxx.js.jss";//目標字元串
Stringregex="((?!\.((css)|(html)|(js)|(json)|(xml))$).)+";//正則表達式
Patternp=Pattern.compile(regex);
Matcherm=p.matcher(s);
if(m.matches()){
System.out.println("匹配");
}else{
System.out.println("不匹配");
}
}
}

運行結果

匹配

4. java中的正則表達式

Java正則表達式 (<img.*?)style=\".*?\" 替換成 $1
其中.*表示0個或0以上多個任意字元
.*?表示0個或0以上多個任意字元的非貪婪匹配,就是假如一個句子中有多個style,它匹配距離最近的那個style,同理後面的.*?匹配距離最近的雙引號
$1表示反向引用,它代表的是正則表達式中的第一個小括弧所括起來的分組的內容,如果有兩個小括弧括起來的內容,則分別用$1,$2表示它們(在替換後的字元串中)
完整的Java程序如下
123456public class CC { public static void main(String[] args) { String s="<img src=\"file/img/2016/12-28/1234-25521482893088459.jpg\" title=\"1234.jpg\" alt=\"\" width=\"396\" height=\"271\" style=\"width: 396px; height: 271px;\"/>"; System.out.println(s.replaceAll("(<img.*?)style=\".*?\"", "$1")); }}
運行結果
<img src="file/img/2016/12-28/1234-25521482893088459.jpg" title="1234.jpg" alt="" width="396" height="271" />

5. JAVA正則表達式

http://blog.pfan.cn/iamben250/34352.html這是我的blog上面的詳細介紹。配中文字元的正則表達式： [\u4e00-\u9fa5]

匹配雙位元組字元(包括漢字在內)：[^\x00-\xff]

應用：計算字元串的長度（一個雙位元組字元長度計2，ASCII字元計1）

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正則表達式：\n[\s| ]*\r

匹配HTML標記的正則表達式：/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正則表達式：(^\s*)|(\s*$)

應用：javascript中沒有像vbscript那樣的trim函數，我們就可以利用這個表達式來實現，如下：

String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}

利用正則表達式分解和轉換IP地址：

下面是利用正則表達式匹配IP地址，並將IP地址轉換成對應數值的Javascript程序：

function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}

不過上面的程序如果不用正則表達式，而直接用split函數來分解可能更簡單，程序如下：

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是："+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配網址URL的正則表達式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正則表達式去除字串中重復的字元的演算法程序：[註：此程序不正確，原因見本貼回復]

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為：abcefgi

我原來在CSDN上發貼尋求一個表達式來實現去除重復字元的方法，最終沒有找到，這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重復的字元，再以重復的字元建立第二個表達式，取到不重復的字元，兩者串連。這個方法對於字元順序有要求的字元串可能不適用。

得用正則表達式從URL地址中提取文件名的javascript程序，如下結果為page1

s=" http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)

利用正則表達式限制網頁表單里的文本框輸入內容：

用正則表達式限制只能輸入中文：onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正則表達式限制只能輸入全形字元： onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正則表達式限制只能輸入數字：onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正則表達式限制只能輸入數字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 出處：藍色理想
前一段時間寫了2段EmEditor的宏，用來統計代碼行數和簡單的規約檢查，稍微整理一下，
下面是從EmEditor的Q&A的提取的實例：雙引號包含的字元串
strings surrounded by double-quotation marks
「.*?」 [ ]包含的字元串
strings surrounded by [ ]
\[[^\[]*?\] 變數名
variable names
[a-zA-Z_][a-zA-Z_0-9]* IP 地址
IP addresses
([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3}) 網頁地址
URL
(\S+)://([^:/]+)(:(\d+))?(/[^#\s]*)(#(\S+))? 各行Tab以後的文字列
lines followed by a tab
\t.*$ 平仮名ひらがな
Hiragana
[\x{3041}-\x{309e}] 全形片仮名全形カタカナ
Full-width Katakana
[\x{309b}-\x{309c}\x{30a1}-\x{30fe}] 半形仮名半形カナ
Half-width Kana
[\x{ff61}-\x{ff9f}] 中日韓漢字
CJK ideographs
[\x{3400}-\x{9fff}\x{f900}-\x{fa2d}] 中日韓漢字元號
CJK ideograph marks
[\x{3000}-\x{3037}] 韓國字元
Hangul
[\x{1100}-\x{11f9}\x{3131}-\x{318e}\x{ac00}-\x{d7a3}] 行頭插入 //
Insert // at start of lines
Find: ^
Replace with: // 刪除行頭 //
Remove // at end of lines
Find: ^//
Replace: 刪除行後的空白文字（包含空格和製表位 Space+Tab）
Remove trailing whitespaces
Find: \s+?$
Replace with: 將(abc)替換為[abc]
Replace (abc) with [abc]
Find: $(.*?)$
Replace: \[\1\] 將<H3 …>替換為<H4 …>
Replace <H3 …> with <H4 …>
Find: <H3(.*?)>
Replace: <H4\1> 將9/13/2003替換為2003年9月13日
Replace 9/13/2003 with 2003.9.13
Find: ([0-9]{1,2})/([0-9]{1,2})/([0-9]{2,4})
Replace: \3年\1月\2日將字母a-z替換為大寫字母
Uppercase characters from a to z
Find: [a-z]
Replace: \U\0 首字母大寫
Capitalize all words
Find: ([a-zA-Z])([a-zA-Z]*)
Replace: \U\1\L\2

6. 關於java正則表達式

^ 和 $ 他們是分別用來匹配字元串的開始和結束，以下分別舉例說明：

"^The": 開頭一定要有"The"字元串;

"of despair$": 結尾一定要有"of despair" 的字元串;

那麼,

"^abc$": 就是要求以abc開頭和以abc結尾的字元串，實際上是只有abc匹配。

"notice": 匹配包含notice的字元串。

你可以看見如果你沒有用我們提到的兩個字元(最後一個例子)，就是說模式(正則表達式) 可以出現在被檢驗字元串的任何地方，你沒有把他鎖定到兩邊。

接著,說說 '*', '+',和 '?',

他們用來表示一個字元可以出現的次數或者順序. 他們分別表示：

"zero or more"相當於{0,},
"one or more"相當於{1,},
"zero or one."相當於{0,1}, 這里是一些例子:
"ab*": 和ab{0,}同義,匹配以a開頭,後面可以接0個或者N個b組成的字元串("a", "ab", "abbb", 等);
"ab+": 和ab{1,}同義,同上條一樣，但最少要有一個b存在 ("ab", "abbb", 等.);
"ab?":和ab{0,1}同義,可以沒有或者只有一個b;
"a?b+$": 匹配以一個或者0個a再加上一個以上的b結尾的字元串.
要點, '*', '+',和 '?'只管它前面那個字元.

你也可以在大括弧裡面限制字元出現的個數，比如

"ab{2}": 要求a後面一定要跟兩個b(一個也不能少)("abb");
"ab{2,}": 要求a後面一定要有兩個或者兩個以上b(如"abb", "abbbb", 等.);
"ab{3,5}": 要求a後面可以有2-5個b("abbb", "abbbb", or "abbbbb").
現在我們把一定幾個字元放到小括弧里，比如：

"a(bc)*": 匹配 a 後面跟0個或者一個"bc";
"a(bc){1,5}": 一個到5個 "bc."
還有一個字元 '│', 相當於OR 操作:

"hi│hello": 匹配含有"hi" 或者 "hello" 的字元串;

"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字元串;

"(a│b)*c": 匹配含有這樣多個(包括0個)a或b，後面跟一個c的字元串;

一個點('.')可以代表所有的單一字元,不包括"\n"

如果,要匹配包括"\n"在內的所有單個字元,怎麼辦?

對了,用'[\n.]'這種模式.

"a.[0-9]": 一個a加一個字元再加一個0到9的數字

"^.{3}$": 三個任意字元結尾 .

中括弧括住的內容只匹配一個單一的字元

"[ab]": 匹配單個的 a 或者 b ( 和 "a│b" 一樣);

"[a-d]": 匹配'a' 到'd'的單個字元 (和"a│b│c│d" 還有 "[abcd]"效果一樣); 一般我們都用[a-zA-Z]來指定字元為一個大小寫英文

"^[a-zA-Z]": 匹配以大小寫字母開頭的字元串

"[0-9]%": 匹配含有形如 x% 的字元串

",[a-zA-Z0-9]$": 匹配以逗號再加一個數字或字母結尾的字元串

你也可以把你不想要得字元列在中括弧里，你只需要在總括弧裡面使用'^' 作為開頭 "%[^a-zA-Z]%" 匹配含有兩個百分號裡面有一個非字母的字元串.

要點:^用在中括弧開頭的時候,就表示排除括弧里的字元。為了php能夠解釋，你必須在這些字元面前後加'',並且將一些字元轉義.

不要忘記在中括弧裡面的字元是這條規路的例外?在中括弧裡面, 所有的特殊字元，包括(''), 都將失去他們的特殊性質 "[*\+?{}.]"匹配含有這些字元的字元串.

還有,正如regx的手冊告訴我們: "如果列表裡含有 ']', 最好把它作為列表裡的第一個字元(可能跟在'^'後面). 如果含有'-', 最好把它放在最前面或者最後面, or 或者一個范圍的第二個結束點[a-d-0-9]中間的『-』將有效.

看了上面的例子,你對{n,m}應該理解了吧.要注意的是,n和m都不能為負整數,而且n總是小於m. 這樣,才能最少匹配n次且最多匹配m次. 如"p{1,5}"將匹配 "pvpppppp"中的前五個p.

下面說說以\開頭的

\b 書上說他是用來匹配一個單詞邊界,就是...比如've\b',可以匹配love里的ve而不匹配very里有ve

\B 正好和上面的\b相反.例子我就不舉了

.....突然想起來....可以到http://www.phpv.net/article.php/251 看看其它用\ 開頭的語法

好,我們來做個應用:

如何構建一個模式來匹配貨幣數量的輸入

構建一個匹配模式去檢查輸入的信息是否為一個表示money的數字。我們認為一個表示money的數量有四種方式： "10000.00" 和 "10,000.00",或者沒有小數部分, "10000" and "10,000". 現在讓我們開始構建這個匹配模式:

^[1-9][0-9]*$

這是所變數必須以非0的數字開頭.但這也意味著單一的 "0" 也不能通過測試. 以下是解決的方法:

^(0│[1-9][0-9]*)$

"只有0和不以0開頭的數字與之匹配"，我們也可以允許一個負號在數字之前:

^(0│-?[1-9][0-9]*)$

這就是: "0 或者一個以0開頭且可能有一個負號在前面的數字." 好了,現在讓我們別那麼嚴謹，允許以0開頭.現在讓我們放棄負號 , 因為我們在表示錢幣的時候並不需要用到. 我們現在指定模式用來匹配小數部分:

^[0-9]+(\.[0-9]+)?$

這暗示匹配的字元串必須最少以一個阿拉伯數字開頭. 但是注意，在上面模式中 "10." 是不匹配的, 只有 "10" 和 "10.2" 才可以. (你知道為什麼嗎)

^[0-9]+(\.[0-9]{2})?$

我們上面指定小數點後面必須有兩位小數.如果你認為這樣太苛刻,你可以改成:

^[0-9]+(\.[0-9]{1,2})?$

這將允許小數點後面有一到兩個字元. 現在我們加上用來增加可讀性的逗號(每隔三位), 我們可以這樣表示:

^[0-9]{1,3}(,[0-9]{3})*(\.[0-9]{1,2})?$

不要忘記 '+' 可以被 '*' 替代如果你想允許空白字元串被輸入話 (為什麼?). 也不要忘記反斜桿』\』在php字元串中可能會出現錯誤 (很普遍的錯誤).

現在，我們已經可以確認字元串了, 我們現在把所有逗號都去掉 str_replace(",", "", $money) 然後在把類型看成 double然後我們就可以通過他做數學計算了.

導航:首頁 > 編程語言 > javaif正則表達式

javaif正則表達式

與javaif正則表達式相關的資料