Ⅰ java精確查找單詞用什麼正則表達式
String txt = "gjkvcddg@this,hjbvf"
你是要查找是否有呢,還是匹配出來?
txt.index("this") 如果有這返回當前位置,否則返回-1
正則匹配:
"@(.+?),"
等....
或切片:
txt.split("@")[1].split(",")[0]
Ⅱ Java正則表達式 匹配 單詞
"\\w+"
\\w表示單詞字元(數字、字母、下劃線)
+號表示一個或多個
Ⅲ Java如何在正則表達式中匹配重復單詞
示例顯示了如何使用regex.Matcher類的p.matcher()方法和m.group()方法在正則表達式中搜索重復的單詞。
import java.util.Scanner;
import java.io.*;
import java.util.regex.*;
import java.util.ArrayList;
public class SearchingDuplicateWords {
public static void main(String[] args) {
ArrayList<String> manyLines = new ArrayList<String>();
ArrayList<String> noRepeat = new ArrayList<String>();
try {
String s1 = "Hello hello Hello there there past pastures ";
Scanner myfis = new Scanner(s1);
while (myfis.hasNext()) {
String line = myfis.nextLine();
String delim = System.getProperty("line.separator");
String[] lines = line.split(delim);
for (String s : lines) {
if (!s.isEmpty() && s != null) {
manyLines.add(s);
}
}
}
if (!manyLines.isEmpty()) {
System.out.print("Original text is:\n");
for (String s : manyLines) {
System.out.println(s);
}
}
if (!manyLines.isEmpty()) {
for (String s : manyLines) {
String result = s.replaceAll("(?i)\\b([a-z]+)\\b(?:\\s+\\1\\b)+", "$1");
noRepeat.add(result);
}
}
if (!noRepeat.isEmpty()) {
System.out.print("After Remove plicates:\n");
for (String s : noRepeat) {
System.out.println(s);
}
}
} catch (Exception ex) {
System.out.println(ex);
}
}
}
Ⅳ Java中什麼是正則表達式
正則表達式 就是將一個類型的數據 按照一定方式 寫成正則表達式的形式 這樣可以辨別數據是否符合這一類型的數據 比如我們的身份證號碼 就是有一定的規則的 這樣我們寫一個 正則表達式 和別人輸入的身份證號碼 比對 如果符合這個正則表達式的規則 就是身份證號碼
Ⅳ JAVA正則表達式判斷 只能包含漢字、英文、「_」和數字 ,正則該怎麼寫呢
正則表達式:[\u4e00-\u9fa5]*|\w*|\d*|_*
代碼如下:
@Test
public void test1(){
//匹配正則表達式表達式
String str = "[\u4e00-\u9fa5]*|\w*|\d*|_*";
Pattern pattern = Pattern.compile(str);
//要匹配的字元串
String mStr = "還有多遠_344fjdk";
System.out.println("測試的字元串:"+mStr);
Matcher m = pattern.matcher(mStr);
//如果匹配到了
if(m.find()){
System.out.println("匹配內容:"+m.group());
}
}
程序運行結果:
(5)java正則表達式單詞擴展閱讀
匹配包括下劃線的任何單詞字元。類似但不等價於「[A-Za-z0-9_]」,"單詞"字元使用Unicode字元集,中文的為:[\u4e00-\u9fa5],表示英文字母的為w,表示數字的為d,表示_的為_,而*號表示的則是0個或多個,|表示的則是或,所以把每個要匹配的用|拼接可以表示要匹配的正則表達式。
Ⅵ java正則表達式如何獲取字元串中所有匹配內容
1.1 句點符號
在玩英文拼字游戲,想要找出三個字母的單詞,而且這些單詞必須以「t」字母開頭,以「n」字母結束。另外,假設有一本英文字典,可以用正則表達式搜索全部內容。要構造出這個正則表達式,可以使用一個通配符——句點符號「.」。這樣,完整的表達式就是「t.n」,匹配「tan」、「ten」、「tin」和「ton」,還匹配「t#n」、「tpn」甚至「t n」,還有其許多無意義的組合。這是因為句點符號匹配所有字元,包括空格、Tab字元甚至換行符:
1.3 「或」符號
如果除了上面匹配的所有單詞之外,還想要匹配「toon」,那麼,可以使用「|」操作符。「|」操作符的基本意義就是「或」運算。要匹配「toon」,使用「t(a|e|i|o|oo)n」正則表達式。這里不能使用方擴號,因為方括弧只允許匹配單個字元;這里必須使用圓括弧「()」。圓括弧還可以用來分組。
1.4 表示匹配次數的符號
下表顯示了正則表達式的語法:
表 1.1 正則表達式語法
Ⅶ java的正則表達式,"\b(\w+)\b\s+\1\b"這個怎麼理解
(\w+)匹配一個詞,
\1匹配第一個匹配組,
在這里就是前面匹配的那個詞.
所以:
(\w+)
\1
匹配兩個完全相同的詞.
(詞里可以有至少一個字母或數字)
\s+
兩個詞當中隔了至少一個能被\s匹配的符號(比如空格,
tab)