A. java正則表達式判斷 只能包含漢字、英文、「_」和數字 ,正則該怎麼寫呢
正則表達式:[\u4e00-\u9fa5]*|\w*|\d*|_*
代碼如下:
@Test
public void test1(){
//匹配正則表達式表達式
String str = "[\u4e00-\u9fa5]*|\w*|\d*|_*";
Pattern pattern = Pattern.compile(str);
//要匹配的字元串
String mStr = "還有多遠_344fjdk";
System.out.println("測試的字元串:"+mStr);
Matcher m = pattern.matcher(mStr);
//如果匹配到了
if(m.find()){
System.out.println("匹配內容:"+m.group());
}
}
程序運行結果:
(1)java正則表達式中文匹配擴展閱讀
匹配包括下劃線的任何單詞字元。類似但不等價於「[A-Za-z0-9_]」,"單詞"字元使用Unicode字元集,中文的為:[\u4e00-\u9fa5],表示英文字母的為w,表示數字的為d,表示_的為_,而*號表示的則是0個或多個,|表示的則是或,所以把每個要匹配的用|拼接可以表示要匹配的正則表達式。
B. java涓媯鏌ュ撳悕鐨勬e垯琛ㄨ揪寮
浠ヤ笅鏄涓涓狫ava涓鐢ㄤ簬媯鏌ュ撳悕鐨勬e垯琛ㄨ揪寮忥紝瀹冭兘澶熷尮閰2鍒8涓奼夊瓧鎴栬2鍒16涓鑻辨枃瀛楁瘝銆
code
String regex = "^([\\u4E00-\\u9FA5]{2,8}|[a-zA-Z]{2,16})$";
鍏蜂綋瑙i噴濡備笅錛
^ 琛ㄧず鍖歸厤瀛楃︿覆鐨勫紑澶
() 琛ㄧず涓涓鎹曡幏緇勶紝鍏朵腑鍖呭惈浜嗕袱涓瀛愭ā寮
[\u4E00-\u9FA5] 琛ㄧず涓涓奼夊瓧瀛楃︼紝鑼冨洿涓篣nicode緙栫爜鐨勪腑鏂囪寖鍥
{2,8} 琛ㄧず璇ュ瓧絎﹀彲浠ュ嚭鐜2鍒8嬈
| 琛ㄧず閫昏緫鎴栵紝琛ㄧず涓や釜瀛愭ā寮忎腑鐨勪換鎰忎竴涓閮藉彲浠ュ尮閰嶆垚鍔
[a-zA-Z] 琛ㄧず涓涓鑻辨枃瀛楁瘝錛屼笉鍖哄垎澶у皬鍐
{2,16} 琛ㄧず璇ュ瓧絎﹀彲浠ュ嚭鐜2鍒16嬈
$ 琛ㄧず鍖歸厤瀛楃︿覆鐨勭粨灝
鍥犳わ紝涓婇潰鐨勬e垯琛ㄨ揪寮忓彲浠ュ尮閰嶉暱搴︿負2鍒8涓奼夊瓧鎴栭暱搴︿負2鍒16涓鑻辨枃瀛楁瘝鐨勫瓧絎︿覆錛屽彲浠ョ敤浜庢鏌ュ撳悕鏄鍚︾﹀悎瑕佹眰銆
C. 請問如何用正則表達式搜重復漢字
正則表達式可以通過某些特定的語法來匹配字元串中的模式,從而實現對字元串中的某些文本的搜索和操作。在用正則表達式搜索重復漢字時,需要使用到兩個關鍵字元:「[]」和「{}」。
以下是實現搜索重復漢字的步驟:
1:創建一個正則表達式字元豎改串,其中漢字可以使用「[]」表示,並且在重復搜索的漢字之前加握帆上「{}」。
2:使用正則表達式編譯器將正則表達式字元串編譯為正則表達式模式。
3:使用正則表達式模式對目標字元串進行匹配。
4:如果匹配到重復漢字,則可以通過正則表達式匹配器的「find()」方法來獲取匹配到的字元串,余皮判並進行後續操作。
如下是一個實現搜索重復漢字的示例代碼:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) {
String str = "中華人民共和國";
String pattern = "([\u4e00-\u9fa5])\1+";
Pattern r = Pattern.compile(pattern);
Matcher m = r.matcher(str);
while (m.find()) {
System.out.println(m.group());
}
}
}
在這個示例中,字元串「str」中的所有重復
D. 求java一個正規表達式,只包含中文、數字、空格、冒號
只包含中文、數字、空格、冒號的Java正則表達式如下
^[\u4e00-\u9fa5 0-9:]+$
我給你個Java語言匹配只包含中文、數字、空格、冒號的程序,你看看吧.
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;
publicclassCC{
publicstaticvoidmain(String[]args){
Strings="你好晚上好:2016";
Stringregex="^[\u4e00-\u9fa50-9:]+$";
Patternp=Pattern.compile(regex);
Matcherm=p.matcher(s);
if(m.matches()){
System.out.println("匹配");
}else{
System.out.println("不匹配");
}
}
}
運行結果
匹配
E. JAVA正則表達式
http://blog.pfan.cn/iamben250/34352.html這是我的blog上面的詳細介紹。配中文字元的正則表達式: [\u4e00-\u9fa5]
匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
應用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
匹配空行的正則表達式:\n[\s| ]*\r
匹配HTML標記的正則表達式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正則表達式:(^\s*)|(\s*$)
應用:javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實現,如下:
String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}
利用正則表達式分解和轉換IP地址:
下面是利用正則表達式匹配IP地址,並將IP地址轉換成對應數值的Javascript程序:
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不過上面的程序如果不用正則表達式,而直接用split函數來分解可能更簡單,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配網址URL的正則表達式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
利用正則表達式去除字串中重復的字元的演算法程序:[註:此程序不正確,原因見本貼回復]
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
我原來在CSDN上發貼尋求一個表達式來實現去除重復字元的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重復的字元,再以重復的字元建立第二個表達式,取到不重復的字元,兩者串連。這個方法對於字元順序有要求的字元串可能不適用。
得用正則表達式從URL地址中提取文件名的javascript程序,如下結果為page1
s=" http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正則表達式限制網頁表單里的文本框輸入內容:
用正則表達式限制只能輸入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
用正則表達式限制只能輸入全形字元: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
用正則表達式限制只能輸入數字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
用正則表達式限制只能輸入數字和英文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 出處:藍色理想
前一段時間寫了2段EmEditor的宏,用來統計代碼行數和簡單的規約檢查,稍微整理一下,
下面是從EmEditor的Q&A的提取的實例:雙引號包含的字元串
strings surrounded by double-quotation marks
「.*?」 [ ]包含的字元串
strings surrounded by [ ]
\[[^\[]*?\] 變數名
variable names
[a-zA-Z_][a-zA-Z_0-9]* IP 地址
IP addresses
([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3}) 網頁地址
URL
(\S+)://([^:/]+)(:(\d+))?(/[^#\s]*)(#(\S+))? 各行Tab以後的文字列
lines followed by a tab
\t.*$ 平仮名 ひらがな
Hiragana
[\x{3041}-\x{309e}] 全形片仮名 全形カタカナ
Full-width Katakana
[\x{309b}-\x{309c}\x{30a1}-\x{30fe}] 半形仮名 半形カナ
Half-width Kana
[\x{ff61}-\x{ff9f}] 中日韓 漢字
CJK ideographs
[\x{3400}-\x{9fff}\x{f900}-\x{fa2d}] 中日韓 漢字元號
CJK ideograph marks
[\x{3000}-\x{3037}] 韓國字元
Hangul
[\x{1100}-\x{11f9}\x{3131}-\x{318e}\x{ac00}-\x{d7a3}] 行頭插入 //
Insert // at start of lines
Find: ^
Replace with: // 刪除行頭 //
Remove // at end of lines
Find: ^//
Replace: 刪除行後的空白文字(包含空格和製表位 Space+Tab)
Remove trailing whitespaces
Find: \s+?$
Replace with: 將(abc)替換為[abc]
Replace (abc) with [abc]
Find: \((.*?)\)
Replace: \[\1\] 將<H3 …>替換為<H4 …>
Replace <H3 …> with <H4 …>
Find: <H3(.*?)>
Replace: <H4\1> 將9/13/2003替換為2003年9月13日
Replace 9/13/2003 with 2003.9.13
Find: ([0-9]{1,2})/([0-9]{1,2})/([0-9]{2,4})
Replace: \3年\1月\2日 將字母a-z替換為大寫字母
Uppercase characters from a to z
Find: [a-z]
Replace: \U\0 首字母大寫
Capitalize all words
Find: ([a-zA-Z])([a-zA-Z]*)
Replace: \U\1\L\2
F. 用JAVA語言編寫正則表達式匹配指定的漢字的方法
匹配中文字元的正則表達式: [\u4e00-\u9fa5] 匹配雙位元組字元(包括漢字在內):[^\x00-\xff] 匹配空行的正則表達式:\n[\s ]*\r 匹配HTML標記的正則表達式:/ <(.*) .* <\/\1 <(.*) \/ / 匹配首尾空格的正則表達式:(^\s*) (\s*$) 用正則表達式限制只能輸入中文:onkeyup= "value=value.replace(/[^\u4E00-\u9FA5]/g, ' ') " onbeforepaste= "clipboardData.setData( 'text ',clipboardData.getData( 'text ').replace(/[^\u4E00-\u9FA5]/g, ' ')) " 用正則表達式限制只能輸入全形字元: onkeyup= "value=value.replace(/[^\uFF00-\uFFFF]/g, ' ') " onbeforepaste= "clipboardData.setData( 'text ',clipboardData.getData( 'text ').replace(/[^\uFF00-\uFFFF]/g, ' ')) "
G. java中正則表達式 一個字元串中提取特定的漢字
針對本文本直接用 "_blank">(\w+) 就能匹配出來。
如果復雜點,可以判斷 「福田」後面的數
如果能確定 BJ5081XCX —— 總是 9位,並且前後有空格,可以用
"_blank">(\w+)(?=\s\w{9}\s) 進一步約束