A. python中匹配ip的正则表达式 如果我要匹配192.168.*.*的网段呢 新手求教!!
importre
reg=re.compile(r"(?<![0-9.])((2[0-4][0-9]|25[0-5]|[01]?[0-9]{1,2}).){3}(2[0-4][0-9]|25[0-5]|[01]?[0-9]{1,2})(?![0-9.])")
(?<![0-9.])((2[0-4][0-9]|25[0-5]|[01]?[0-9]{1,2}).){3}(2[0-4][0-9]|25[0-5]|[01]?[0-9]{1,2})(?![0-9.])
从文本中匹配ip的正则表达式
importre(?<![d.])192.168(.(2[0-4]d|25[0-5]|[01]?d{1,2})){2}(?![d.])
reg=re.compile(r"(?<![d.])192.168(.(2[0-4]d|25[0-5]|[01]?d{1,2})){2}(?![d.])")
在文本中匹配 192.168网段的正则表达式
B. 从零开始学Python爬虫(四):正则表达式
Regular Expression, 正则表达式, 种使 表达式的 式对字符串进 匹配的语法规则。
我们抓取到的 源代码本质上就是 个超 的字符串, 想从 提取内容。 正则再合适不过了。
正则的优点: 速度快, 效率 , 准确性 正则的缺点: 新 上 难度有点 。
不过只要掌握了正则编写的逻辑关系, 写出 个提取 内容的正则其实并不谈旦复杂
正则的语法: 使 元字符进 排列组合 来匹配字符串
在线测试正则表达式网址:
https://tool.oschina.net/regex/
元字符: 具有固定含义的特冲旦殊符号 常 元字符:
量词: 控制前 的元字符出现的次数
贪婪匹配和惰性匹配
这两个要着重的说 下,因为我们写爬 的最多的就是这个惰性匹配。
先看案例
那么接下来的问题是, 正则我会写了, 怎么在python程序中使 正则呢?答案是re模块
re模块中我们只需要记住这么 个功能就 够我们使 了。散侍扰
下面一个案例,是练习用正则表达式提取豆瓣电影top250的数据并保存,一起来学一下吧。
C. python怎么做让正则只匹配输出url中的域名
代码如下(下方源代码部分url为空,请自行添加任意地址测试):
import re
url = ""
pattern = r'//(.+?)/'
domain = re.search(pattern,url).group(1)
print(domain)
D. python怎么样使用正则表达式匹配用户输入的为文件路径 就譬如像: E:\index.ph
你好:
正则表达式语法:
##总结
##^匹配字符串的开始。
##$匹配字符串的结尾。
##匹配一个单词的边界。
##d匹配任意数字。
##D匹配任意非数字字符。
##x?匹配一个可选的x字符(换言之,它匹配1次或者0次x字符)。
##x*匹配0次或者多次x字符。
##x+匹配1次或者多次x字符。
##x{n,m}匹配x字符,至少n次,至多m次。
##(a|b|c)要么匹配a,要么匹配b,要么匹配c。
##(x)一般情况下表示一个记忆组(rememberedgroup)。你可以利用re.search函数返回对
##象的groups()函数获取它的值。
##正则表达式中的点号通常意味着“匹配任意单字符”
E. 请教Python中匹配IP的正则表达式
下面是IPv4的IP正则匹配表达式
importre
#简单的匹配给定的字符串是否是ip地址,下面的例子它不是IPv4的地址,但是它满足正则表达式
ifre.match(r"^(?:[0-9]{1,3}.){3}[0-9]{1,3}$","272.168,1,1"):
print"IPvaild"
else:
print"IPinvaild"
#精确的匹配给定的字符串是否是IP地址
ifre.match(r"^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$","223.168.1.1"):
print"IPvaild"
else:
print"IPinvaild"
#简单的从长文本中提取中提取ip地址
string_ip="isthis289.22.22.22ip?
result=re.findall(r"(?:[0-9]{1,3}.){3}[0-9]{1,3}",string_ip)
ifresult:
printresult
else:
print"recannotfindip"
#精确提取IP
result=re.findall(r"(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)",string_ip):
ifresult:
printresult
else:
print"recannotfindip"
下面是IPv6的正则匹配表达式
string_IPv6="1050:0:0:0:5:600:300c:326b"
#匹配是否满足IPv6格式要求,请注意例子里大小写不敏感
ifre.match(r"^(?:[A-F0-9]{1,4}:){7}[A-F0-9]{1,4}$",string_IPv6,re.I):
print"IPv6vaild"
else:
print"IPv6invaild"
#提取IPv6,例子里大小写不敏感
result=re.findall(r"(?<![:.w])(?:[A-F0-9]{1,4}:){7}[A-F0-9]{1,4}(?![:.w])",string_IPv6,re.I)
#打印提取结果
printresult