導航:首頁 > 編程語言 > php正則貪婪匹配

php正則貪婪匹配

發布時間:2023-02-24 13:07:51

① 關於php正則的貪婪模式

你理解錯了吧,如果不取消貪婪模式就有可能匹配到www.aaa.bbb.com.com這種情況,取消貪婪模式就會在遇到第一個.com就返回匹配結果,也就是aaa.bbb

② php正則截取指定符號之間的字元串

按照你的要求截取第一個【和最後一個】之間的字元串的php程序如下

(用正則表達式中的貪婪匹配模式,取第一捕獲組的數據)

<?php

$str="擊鏈器【到手】得理多】";

$regex="/【(.*)】/";

preg_match_all($regex,$str,$result);

echo $result[1][0];

?>

③ php正則表達式/U是什麼意思

U表示不要貪婪匹配i表示不區分大小寫
比如說
$str = "<Div>第一</div><Div>第二</div>";
$p = "~<div>.*</div>~Ui";
?
? preg_match($p,$str,$arr);
echo $arr[0];?
?
你如果不加U 就輸出 "<Div>第一</div><Div>第二</div>"
加了 就輸出 "<Div>第一</div>"
如果不加i就匹配不上 因為<Div>中d是大寫

④ php正則 包含<>的怎麼寫

按照你的要求匹配asd標簽的php程序如下(見圖)

點可以匹配除換行符外的所有字元,

加模式符is表示匹配不區分大小寫且點可以匹配換行符,

問號是非貪婪匹配,匹配符合要求的最短字元串,

結果取第一捕獲組的數據.

你的正則匹配除尖括弧外的所有字元,所以無法匹配尖括弧.

⑤ php 正則表達式 貪婪模式怎麼寫

MTracer正則表達式驗證工具,一般好用,我是只下載了個這個玩了一會覺得上手挺簡單的,就推薦下。正則表達式工具下載地址:MTracer.rar(首先打開工具,在右邊有上下兩個輸入框,上面那個是輸入正則的,下面那個是輸入要匹配字元串的,上下內容輸入好以後,就可以單擊匹配按鈕了,如果覺得匹配ok的話,就可以直接單擊上面菜單的代碼生成,來生成你要的C#代碼,java代碼,Script代碼等等)比如我要匹配兩個標簽里的所有東西如asdawdsadwdasdmwioasdasd我要匹配兩個Div之間的東西,那麼就應該寫[/S/s]*注意,你用request對象去請求回來的頁面是帶有/r 、/n 、/t這些標簽的,所有你要學會如何去表示這些標簽,另外捕獲標簽的時候,你是否要最大限度的匹配還是要最小限度的去匹配,下面就說明下這兩種模式 貪婪模式 和 非貪婪模式 :在正則表達式的匹配次數後面再添加一個 ? 表示 非貪婪模式
常用的匹配次數有 *、{m.n}、+貪婪模式:表達式在可匹配可不匹配的時候,也是盡可能的 "要匹配"。
非貪婪模式表達式盡可能少的匹配,使可匹配可不匹配的表達式,盡可能的 "不匹配"。
如bdxxx taaaa
表達式A1: .*
結果: 匹配1次
表達式A2:.*?
結果:匹配2次
表達式B1:[/w/s/]{1,}?
結果:匹配2次去掉問號結果:匹配1次同理 將{1,}改+ 也可以得到相同的匹配結果,好了今天就寫這么多了,哪天有空了再寫寫
-

⑥ PHP 正則表達式總結

PHP 正則表達式總結

1.PHP中兩個常用的正則函數

a.preg_match 正則函數,以perl語言為基礎

語法:preg_match( mode,string subject,array matches)

說明:mode參數---- 正則的模塊,也就是正則表達式(語法)

subject參數---- 正則的內容

matches參數---- 正則的結果(獲得一個數組的形式)

b.ereg 正則函數,以POSIX基礎(Unix、Script)

語法:ereg(mode ,string subject, array regs)

2.正則表達式中包括的元素

a.原子(普通字元:a-z A-Z 0-9 、原子表、轉義字元)

b.元字元(有特殊功能的字元,如:# 、*)

c.模式修正符(系統內置部分字元 i、m、S、U ...)

3.正則表達式中的「原子」

a.a-z A-Z _ 0-9 //最常見的字元

b.(abc)(skd) //用圓括弧包含起來的單元符號(一個整體)

c.[abcs][^abd] //用方括弧包含的原子表,原子表中的^代表排除或相反的內容

d.轉義字元

d 包含所有的數字[0-9]

D 除所有數字外[^0-9]

w 包含所有英文字元[a-z A-Z 0-9]

W 除所有英文字元外[^a-z A-Z 0-9]

s 回車,換行等

......

註明: 圓括弧 必須是整體才能匹配; 方括弧 只要是其子集,都可以匹配(內容存在)

4.正則表達式元字元

* 匹配前一個內容的0次1次或多次

. 匹配內容的0次1次或多次,但不包含回車換行(代指自己,任何內容)

+ 匹配前一個內容的1次或多次

? 匹配前一個內容的.0次或1次

| 選擇匹配類似PHP中的| (因為這個運算符合是弱類型導致前面最為整體匹配,類似一個單詞匹配)

^ 匹配字元串首部內容

$ 匹配字元串尾部內容

b 匹配單詞邊界,邊界可以是空格或者特殊符合(有單詞分界符,類似空格)

B 匹配除帶單詞邊界意外內容(無單詞分界符)

{m} 匹配前一個內容的重復次數為M次

{m,} 匹配前一個內容的重復次數大於等於M次

{m,n} 匹配前一個內容的重復次數M次到N次

( ) 合並整體匹配,並放入內存,可使用1 2…依次獲取 (調用放入內存中的內容)

5.運算順序

依然遵循從左到→右的運算規則

優先順序:

( ) 圓括弧因為是內存處理所以最高

* ? + { } 重復匹配內容其次

^ $ b 邊界處理第三

| 條件處理第四

最後按照運算順序計算匹配

6.模式修正符

模式修正符是為正則表達式增強和補充的一個功能,使用在正則之外 例如:/ 正則 / U

常用修正符:

i 正則內容在匹配時候不區分大小寫(默認是區分的)

m 在匹配首內容或者尾內容時候採用多行識別匹配

s 將轉義回車取消是為單行匹配如. 匹配的時候

x 忽略正則中的空白

A 強制從頭開始匹配

D 強制$匹配尾部無任何內容 n

U 禁止貪婪匹配 只跟蹤到最近的一個匹配符並結束, 常用在採集程序上的正則表達式

7.匹配功能

preg_match_all 全部匹配函數

語法:preg_match_all ( string pattern, string subject, array matches [, int flags] )

說明:對結果排序使 $matches[0] 為全部模式匹配的數

用途:截取比較詳細的內容,採集網頁,分析文本

8.替換功能

preg_replace 正則替換函數

語法:preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )

說明:通過正則表達式來替換相關內容,類似之前學過的str_replace字元串替換,但 功能要強於它

提示:1、替換內容可以是一個正則也可以是數組正則

2、替換內容可以通過修正符e來解決替換執行內容

用途:替換一些比較復雜的內容上,也可以用於內容的轉換上

9.分割功能

preg_split 正則切割

語法:preg_split ( string pattern, string subject [, int limit [, int flags]] )

說明:通過正則表達式來切割相關內容,類似之前學過的explode切割函數,但explode 只能按照一種方式切割有局限性。

;

⑦ thinkphp驗證器正則常用規則

ThinkPHP的自動驗證常用的正則

一般我們見的比較多的是設置規則為require、email之類的,其實這些本身也是屬於正則表達式驗證方式,只是系統內置定義了一些常用的正則表達式而已。這些內置的正則表達式的定義可以參考model類的regex方法,內置支持的正則定義包括:
require 欄位必須、email 郵箱、url URL地址、currency 貨幣、number 數字、zip 郵編、integer 整數、double 浮點數、english 英文字母,但是並不局限於這些正則規則的,我們完全可以直接在驗證規則裡面使用正則表達式進行定義,這樣我們可以憑借強大的正則表達式來進行表單欄位驗 證,例如:

附上一些表單驗證中比較常用的正則表達式寫法:

匹配特定字元串:

限定符
限定符用來指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6種。

正則表達式的限定符有:

ThinkPHP的自動驗證機制是為了進行表單數據驗證,驗證可以支持function、 callback、confirm、equal、unique和regex,這里要講的是使用正則表達式進行驗證。

特殊字元

許多元字元要求在試圖匹配它們時特別對待。若要匹配這些特殊字元,必須首先使字元"轉義",即,將反斜杠字元 放在它們前面。下表列出了正則表達式中的特殊字元:

正則表達式(regular expression)描述了一種字元串匹配的模式(pattern),可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。

例如:

構造正則表達式的方法和創建數學表達式的方法一樣。也就是用多種元字元與運算符可以將小的表達式結合在一起來創建更大的表達式。正則表達式的組件可以是單個的字元、字元集合、字元范圍、字元間的選擇或者所有這些組件的任意組合。

正則表達式是由普通字元(例如字元 a 到 z)以及特殊字元(稱為"元字元")組成的文字模式。模式描述在搜索文本時要匹配的一個或多個字元串。正則表達式作為一個模板,將某個字元模式與所搜索的字元串進行匹配。

普通字元包括沒有顯式指定為元字元的所有可列印和不可列印字元。這包括所有大寫和小寫字母、所有數字、所有標點符號和一些其他符號。

非列印字元也可以是正則表達式的組成部分。下表列出了表示非列印字元的轉義序列:

所謂特殊字元,就是一些有特殊含義的字元,如上面說的 runoo*b 中的 ,簡單的說就是表示任何字元串的意思。如果要查找字元串中的 * 符號,則需要對 * 進行轉義,即在其前加一個 : runo*ob 匹配 runo ob。

許多元字元要求在試圖匹配它們時特別對待。若要匹配這些特殊字元,必須首先使字元"轉義",即,將反斜杠字元 放在它們前面。下表列出了正則表達式中的特殊字元:

限定符用來指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6種。

正則表達式的限定符有:

由於章節編號在大的輸入文檔中會很可能超過九,所以您需要一種方式來處理兩位或三位章節編號。限定符給您這種能力。下面的正則表達式匹配編號為任何位數的章節標題:

請注意,限定符出現在范圍表達式之後。因此,它應用於整個范圍表達式,在本例中,只指定從 0 到 9 的數字(包括 0 和 9)。

這里不使用 + 限定符,因為在第二個位置或後面的位置不一定需要有一個數字。也不使用 ? 字元,因為使用 ? 會將章節編號限制到只有兩位數。您需要至少匹配 Chapter 和空格字元後面的一個數字。

如果您知道章節編號被限制為只有 99 章,可以使用下面的表達式來至少指定一位但至多兩位數字。

上面的表達式的缺點是,大於 99 的章節編號仍只匹配開頭兩位數字。另一個缺點是 Chapter 0 也將匹配。只匹配兩位數字的更好的表達式如下:

* 、+限定符都是貪婪的,因為它們會盡可能多的匹配文字,只有在它們的後面加上一個?就可以實現非貪婪或最小匹配。

例如,您可能搜索 HTML 文檔,以查找括在 H1 標記內的章節標題。該文本在您的文檔中如下:

<H1>Chapter 1 - 介紹正則表達式</H1>

貪婪: 下面的表達式匹配從開始小於符號 (<) 到關閉 H1 標記的大於符號 (>) 之間的所有內容。

非貪婪: 如果您只需要匹配開始和結束 H1 標簽,下面的非貪婪表達式只匹配 <H1>。

如果只想匹配開始的 H1 標簽,表達式則是:

通過在 *、+ 或 ? 限定符之後放置 ?,該表達式從"貪心"表達式轉換為"非貪心"表達式或者最小匹配。

定位符使您能夠將正則表達式固定到行首或行尾。它們還使您能夠創建這樣的正則表達式,這些正則表達式出現在一個單詞內、在一個單詞的開頭或者一個單詞的結尾。

正則表達式的定位符有:

閱讀全文

與php正則貪婪匹配相關的資料

熱點內容
桌面文件全部加密 瀏覽:401
6s怎麼外接u盤需要什麼app 瀏覽:131
linux查看文件許可權命令 瀏覽:685
安卓手游存檔怎麼用 瀏覽:761
linuxyum安裝ftp 瀏覽:690
村委會主任可以推行政命令嗎 瀏覽:102
電腦文件夾封面多張圖片 瀏覽:263
網吧總伺服器叫什麼 瀏覽:922
多個演算法解決同一個問題 瀏覽:455
小車解壓後我的購車發票呢 瀏覽:977
做app開發用什麼雲伺服器 瀏覽:177
linux網卡子介面 瀏覽:985
21歲職高畢業學程序員怎麼學 瀏覽:321
vs如何對單個文件編譯 瀏覽:6
為什麼有的電腦不能安裝python 瀏覽:75
金蝶迷你版加密狗檢測到過期 瀏覽:186
硬體描述語言編譯結果 瀏覽:655
程序員逆天改命 瀏覽:19
金斗雲伺服器 瀏覽:447
港口工程pdf 瀏覽:770