php正则全角字符_超常用的PHP正则表达式收集整理

A. php正则表达式的使用技巧

PHP正则表达式的定义

用于描述字符排列和匹配模式的一种语法规则它主要用于字符串的模式分割匹配查找及替换操作

PHP中的正则函数

PHP中有两套正则函数两者功能差不多分别为

一套是由PCRE（Perl Compatible Regular Expression）库提供的使用 preg_ 为前缀命名的函数

一套由POSIX（Portable Operating System Interface of Unix ）扩展提供的使用以 ereg_ 为前缀命名的函数（POSIX的正则函数库自PHP 以后就不在推荐使用从PHP 以后就将被移除）

由于POSIX正则即将推出历史舞台并且PCRE和perl的形式差不多更利于我们在perl和php之间切换所以这里重点介绍PCRE正则的使用

PCRE正则表达式

PCRE全称为Perl Compatible Regular Expression 意思是Perl兼容正则表达式

在PCRE中通常将模式表达式（即正则表达式）包含在两个反斜线 / 之间如 /apple/

正则中重要的几个概念有元字符转义模式单元（重复）反义引用和断言这些概念都可以在文章[ ]中轻松的理解和掌握

常用的元字符(Meta character)

元字符说明

/A 匹配字符串串首的原子

/Z 匹配字符串串尾的原子

/b 匹配单词的边界 //bis/ 匹配头为is的字符串 /is/b/ 匹配尾为is的字符串 //bis/b/ 定界

/B 匹配除单词边界之外的任意字符 //Bis/ 匹配单词 This 中的 is

/d 匹配一个数字等价于[ ]

/D 匹配除数字以外任何一个字符等价于[^ ]

/w 匹配一个英文字母数字或下划线等价于[ a zA Z_]

/W 匹配除英文字母数字和下划线以外任何一个字符等价于[^ a zA Z_]

/s 匹配一个空白字符等价于[/f/t/v]

/S 匹配除空白字符以外任何一个字符等价于[^/f/t/v]

/f 匹配一个换页符等价于 /x c 或 /cL

匹配一个换行符等价于 /x a 或 /cJ

匹配一个回车符等价于/x d 或 /cM

/t 匹配一个制表符等价于 /x /或/cl

/v 匹配一个垂直制表符等价于/x b或/ck

/oNN 匹配一个八进制数字

/xNN 匹配一个十六进制数字

/cC 匹配一个控制字符

模式修正符（Pattern Modifiers）

模式修正符在忽略大小写匹配多行中使用特别多掌握了这一个修正符往往能解决我们遇到的很多问题

i －可同时匹配大小写字母

M －将字符串视为多行

S －将字符串视为单行换行符做普通字符看待使匹配任何字符

X －模式中的空白忽略不计

U －匹配到最近的字符串

e －将替换的字符串作为表达使用

格式 /apple/i匹配 apple 或 Apple 等忽略大小写 /i

PCRE的模式单元

// 提取第一位的属性

/^/d{ } ([/W])/d{ }// /d{ }$匹配 / / 等字符串但上述正则表达式不匹配 / 的格式这是因为模式 [/W] 的结果 / 已经被存储下个位置 / 引用时其匹配模式也是字符 /

当不需要存储匹配结果时使用非存储模式单元（？）

例如/(?:a|b|c)(D|E|F)// g/ 将匹配 aEEg 在一些正则表达式中使用非存储模式单元是必要的否则需要改变其后引用的顺序上例还可以写成/（a|b|c）(C|E|F)/ g/

PCRE正则表达式函数

以下为引用的内容

preg_match()和preg_match_all() preg_quote() preg_split() preg_grep() preg_replace()

函数的具体使用我们可以通过PHP手册来找到下面分享一些平时积累的正则表达式

匹配action属性

以下为引用的内容

$str = ; $match = ; preg_match_all( //s+action=/ (?!)( *?)/ /s/ $str $match); print_r($match);

在正则中使用回调函数

以下为引用的内容

/** * replace some string by callback function * */ function callback_replace() { $url = ; $str = ; $str = preg_replace ( /(?<=/saction=/ )(?!)( *?)(?=/ /s)/e search(/$url // ) $str ); echo $str; } function search($url $match){ return $url / $match; }

带断言的正则匹配

以下为引用的内容

$match = ; $str = xxxxxx cn bold font paragraph text

; preg_match_all ( /(?<=<(/w{ })>) *(?=</// >)/ $str $match ); echo 匹配没有属性的HTML标签中的内容 ; print_r ( $match );

替换HTML源码中的地址

以下为引用的内容

$form_ = preg_replace ( /(?<=/saction=/ |/ssrc=/ |/s)(?!|javascript)( *?)(?=/ /s)/e add_url(/$url / // / ) $form_ );

lishixin/Article/program/PHP/201311/21027

B. 超常用的PHP正则表达式收集整理

以下就是对超常用的PHP正则表达式进行的收集整理，为了方便大家更快更好的掌握php正则表达式。
一、表单验证匹配
验证账号，字母开头，允许
5-16
字节，允许字母数字下划线：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
验证账号，不能为空，不能有空格，只能是英文字母：^\S+[a-z
A-Z]$
验证账号，不能有空格，不能非数字：^\d+$
验证用户密码，以字母开头，长度在
6-18
之间：^[a-zA-Z]\w{5,17}$
验证是否含有
^%&',;=?$\
等字符：[^%&',;=?$\x22]+
匹配Email地址：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配腾讯QQ号：[1-9][0-9]{4,}
匹配日期，只能是
2004-10-22
格式：^\d{4}\-\d{1,2}-\d{1,2}$
匹配国内电话号码：^\d{3}-\d{8}|\d{4}-\d{7,8}$------------评注：匹配形式如010-12345678
或0571-12345678
或
0831-1234567
匹配中国邮政编码：^[1-9]\d{5}(?!\d)$
匹配身份证：\d{14}(\d{4}|(\d{3}[xX])|\d{1})------------评注：中国的身份证为15
位或18
位
不能为空且二十字节以上：^[\s|\S]{20,}$
二、字符匹配
匹配由
26
个英文字母组成的字符串：^[A-Za-z]+$
匹配由
26
个大写英文字母组成的字符串：^[A-Z]+$
匹配由
26
个小写英文字母组成的字符串：^[a-z]+$
匹配由数字和
26
个英文字母组成的字符串：^[A-Za-z0-9]+$
匹配由数字、26个英文字母或者下划线组成的字符串：^\w+$
匹配空行：\n[\s|
]*\r
匹配任何内容：[\s\S]*
匹配中文字符：[\x80-\xff]+
或者
[\xa1-\xff]+
只能输入汉字：^[\x80-\xff],{0,}$
匹配双字节字符(包括汉字在内)：[^\x00-\xff]
三、匹配数字
只能输入数字：^[0-9]*$
只能输入n位的数字：^\d{n}$
只能输入至少n位数字：^\d{n,}$
只能输入m-n位的数字：^\d{m,n}$
匹配正整数：^[1-9]\d*$
匹配负整数：^-[1-9]\d*$
匹配整数：^-?[1-9]\d*$
匹配非负整数（正整数
+
0）：^[1-9]\d*|0$
匹配非正整数（负整数
+
0）：^-[1-9]\d*|0$
匹配正浮点数：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
匹配负浮点数：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
匹配浮点数：^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
匹配非负浮点数（正浮点数
+
0）：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
匹配非正浮点数（负浮点数
+
0）：^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
四、其他
匹配HTML标记的正则表达式（无法匹配嵌套标签）：<(\S*?)[^>]*>.*?</\1>|<.*?
/>
匹配网址
URL
：[a-zA-z]+://[^\s]*
匹配
IP
地址：((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)
匹配完整域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?
提示
上述正则表达式通常都加了
^
与
$
来限定字符的起始和结束，如果需要匹配的内容包括在字符串当中，可能需要考虑去掉
^
和
$
限定符。
以上正则表达式仅供参考，使用时请检验后再使用，希望通过这些超常用的PHP正则表达式

C. php如何判断是字符串全角还是半角

第一步：新建程序
使用Dreamweaver或记事本新建一个PHP程序，这是所有开发必须经过的开始，然后输入测试段代码（Hello World！），并运行。

第二步：输入英文分号并运行
为了便于后面的比较，在编辑器新增一个<div>标签并做对齐，输入文字：我是英文PHP的分号(;)，并在浏览器中运行

第三步：对比输入中文分号再运行
接着输入一段文字，我是中文PHP的分号（；），在浏览器中运行，并作比较，中文分号比英文分号更大更宽

第四步：输入英文半角并运行
在编辑器中新增一个<div>标签，输入文字：我是PHP的半角写法：php，并运行，并记录

第五步：全半角及中英文切换
很多非专业的人不会切换全半角，切换全半角方式为Shift+Space键盘，也可以点击输入法切换

第六步：输入英文全角再运行
同理，在编辑器中输入文字：我是PHP全角写法：php，并运行，比较全半角的区别（注：全角只在英文小写字母才有作用），全角字符宽度明显大于半角。

第七步：对比全角和半角
全角字符占位大于半角。

第八步：对比中文和英文
英文符号再大小以及占位宽度比中文符号小

D. 请问 php 正则中的这些是什么编码呢

一：[\x81-\xfe]格式的正则：

$s=preg_replace('/^([\x81-\xfe][\x40-\xfe])*/','0',$neirong); 这里面的大多是日韩文字

二：x{4e00}格式的正则：

preg_match("/^[\x{4e00}-\x{9fa5}]{1,4}/u",$str); 这里面是匹配中文；

——————————————————————————
这些字符集尤其是日文字符集的各种字、标点以及特殊符号的时候有所帮助。
UTF8
[\x01-\x7f]|[\xc0-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}
UTF16
[\x00-\xd7][\xe0-\xff]|[\xd8-\xdf][\x00-\xff]{2}
JIS
[\x20-\x7e]|[\x21-\x5f]|[\x21-\x7e]{2}
SJIS
[\x20-\x7e]|[\xa1-\xdf]|([\x81-\x9f]|[\xe0-\xef])([\x40-\x7e]|[\x80-\xfc])
EUC_JP
[\x20-\x7e]|\x81[\xa1-\xdf]|[\xa1-\xfe][\xa1-\xfe]|\x8f[\xa1-\xfe]{2}
EUC_JP标点符号及特殊字符
[\xa1-\xa2][\xa0-\xfe]
EUC_JP全角数字
\xa3[\xb0-\xb9]
EUC_JP全角大写英文
\xa3[\xc1-\xda]
EUC_JP全角小写英文
\xa3[\xe1-\xfa]
EUC_JP全角平假名
\xa4[\xa1-\xf3]
EUC_JP全角片假名 [color=Red]2007-03-12 15:00更新[/color]
\xa3[\xb0-\xb9]|\xa3[\xc1-\xda]|\xa5[\xa1-\xf6][\xa3][\xb0-\xfa]|[\xa1][\xbc-\xbe]|[\xa1][\xdd]
EUC_JP全角汉字 [color=Red]2007-03-12 15:06更新[/color]
[\xb0-\xcf][\xa0-\xd3]|[\xd0-\xf4][\xa0-\xfe]|[\xB0-\xF3][\xA1-\xFE]|[\xF4][\xA1-\xA6]|[\xA4][\xA1-\xF3]|[\xA5][\xA1-\xF6]|[\xA1][\xBC-\xBE]
Big5
[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|[\xa1-\xfe])
GBK
[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]
GB2312汉字
[\xb0-\xf7][\xa0-\xfe]
GB2312半角标点符号及特殊符号
\xa1[\xa2-\xfe]
GB2312罗马数组及项目序号
\xa2([\xa1-\xaa]|[\xb1-\xbf]|[\xc0-\xdf]|[\xe0-\xe2]|[\xe5-\xee]|[\xf1-\xfc])
GB2312全角标点及全角字母
\xa3[\xa1-\xfe]
GB2312日文平假名
\xa4[\xa1-\xf3]
GB2312日文片假名
\xa5[\xa1-\xf6]
补充:
GB18030
[\x00-\x7f]|[\x81-\xfe][\x40-\xfe]|[\x81-\xfe][\x30-\x39][\x81-\xfe][\x30-\x39]
[color=Red]2007-03-12 21:35 补充[/color]
日文半角空格
\x20
SJIS全角空格
(?:\x81\x81)
SJIS全角数字
(?:\x82[\x4f-\x58])
SJIS全角大写英文
(?:\x82[\x60-\x79])
SJIS全角小写英文
(?:\x82[\x81-\x9a])
SJIS全角平假名
(?:\x82[\x9f-\xf1])
SJIS全角平假名扩展
(?:\x82[\x9f-\xf1]|\x81[\x4a\x4b\x54\x55])
SJIS全角片假名
(?:\x83[\x40-\x96])
SJIS全角片假名扩展
(?:\x83[\x40-\x96]|\x81[\x45\x5b\x52\x53])
EUC_JP全角空格
(?:\xa1\xa1)
EUC半角片假名
(?:\x8e[\xa6-\xdf])

——————————————————————————

下面是utf-8编码的例子：
$str = "汉字";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

下面的例子包含gbk，gb2312的例子：

<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式
{
echo "<font color=red>您输入的[".$str."]含有违法字符</font>";
}
else
{
echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>";
}
}
?>

E. PHP常用正则表达式汇总

1.
^d+$"//非负整数(正整数
+
0)
2.
"^[0-9]*[1-9][0-9]*$"//正整数
3.
"^((-d+)|(0+))$"//非正整数(负整数
+
0)
4.
"^-[0-9]*[1-9][0-9]*$"//负整数
5.
"^-?d+$"//整数
6.
"^d+(.d+)?$"//非负浮点数(正浮点数
+
0)
7.
"^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$"//正浮点数
8.
"^((-d+(.d+)?)|(0+(.0+)?))$"//非正浮点数(负浮点数
+
0)
9.
"^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$"//负浮点数
10.
"^(-?d+)(.d+)?$"//浮点数
11.
"^[A-Za-z]+$"//由26个英文字母组成的字符串
12.
"^[A-Z]+$"//由26个英文字母的大写组成的字符串
13.
"^[a-z]+$"//由26个英文字母的小写组成的字符串
14.
"^[A-Za-z0-9]+$"//由数字和26个英文字母组成的字符串
15.
"^w+$"//由数字、26个英文字母或者下划线组成的字符串
16.
"^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$"//email地址
17.
"^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$"//url
18.
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/
//
年-月-日
19.
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/
//
月/日/年
20.
"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$"
//Emil
21.
/^((+?[0-9]{2,4}-[0-9]{3,4}-)|([0-9]{3,4}-))?([0-9]{7,8})(-[0-9]+)?$/
//电话号码
22.
"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$"
//IP地址
23.
匹配中文字符的正则表达式：
[u4e00-u9fa5]
24.
匹配双字节字符(包括汉字在内)：[^x00-xff]
25.
匹配空行的正则表达式：n[s|
]*r
26.
匹配HTML标记的正则表达式：/<(.*)>.*</1>|<(.*)
/>/
27.
匹配首尾空格的正则表达式：(^s*)|(s*$)
28.
匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
29.
匹配网址URL的正则表达式：^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$
30.
匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
31.
匹配国内电话号码：(d{3}-|d{4}-)?(d{8}|d{7})?
32.
匹配腾讯QQ号：^[1-9]*[1-9][0-9]*$
33.
元字符及其在正则表达式上下文中的行为：
34.
将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。
35.
^
匹配输入字符串的开始位置。如果设置了
RegExp
对象的Multiline
属性，^
也匹配
’n’
或
’r’
之后的位置。
36.
$
匹配输入字符串的结束位置。如果设置了
RegExp
对象的Multiline
属性，$
也匹配
’n’
或
’r’
之前的位置。
37.
*
匹配前面的子表达式零次或多次。
38.
+
匹配前面的子表达式一次或多次。+
等价于
{1,}。
39.
?
匹配前面的子表达式零次或一次。?
等价于
{0,1}。
40.
{n,}
n
是一个非负整数，至少匹配n
次。
41.
{n,m}
m
和
n
均为非负整数，其中n
<=
m。最少匹配
n
次且最多匹配
m
次。在逗号和两个数之间不能有空格。

导航:首页 > 编程语言 > php正则全角字符

php正则全角字符

与php正则全角字符相关的资料