❶ python一段小函数解释
一般我们常见的网址后缀(suffix)是 cn,或者net,或者com,你说的就是域名的后缀列表
后面代码就是用dot把域名分隔开,
比如www..com 被拆分成[ ‘www','','com']
经过for循环后,到com的时候,进入if分支,而前面走的是else分支,所以可以看到sdomain的变化如下:
遇到www, sdomain包含['www']
遇到 sdomain被替换为['']
遇到com,走if分支,append,变成 ['','com']
然后join后就变成 .com
不过不知道这么些的理由,要是我,就用正则表达式,或者直接保留后面两个部分
domain=url.split('.')
if domain[-1] in suffixs:
return string.join(domain[-2:],'.')
else:
return None #not valid domain
❷ 有没有可以像百度爬虫一样的python程序。把中国所有域名都采集保存下来。希望有大哥可以给我一份,
你表达的不是很清楚!
采集域名有啥用?
你是说采集每个正常运行的域名下的网站内容吗?
但我得告诉,这个程序很多,搜索引擎很多人都写过!但你得有硬件成本才行啊!中国啊,多少个网站!你如果你用单台电脑采集,估计你的从现在开始到你老死还采集不完!网络的服务器数量已经数以万计,懂吗?
如果你只采集几个特定的网站,还可以搞的定啊
❸ python如何去除字符串后面的日期,只留下域名
你好,由于日期长度固定,或者说格式固定,因此可以利用一些已有函数删除每个字符串后面的指定长度的字符或者格式。可以了解一下re正则表达式和python提供的String库或者其他库。找到两篇文章,希望对你有所帮助。
python删除字符串中指定字符的方法
python 字符串 去除 特定位置字符
如果有帮助的话,希望给个采纳,谢谢啦。
❹ python怎么批量查询域名备案信息
1.把要反查的ip地址写在c:\ip.txt里面,每个ip或者域名一行
2.python reverse_ip.py
3.用Excel打开c:\result.csv,结果就都在里面了!
❺ Python获取url中域名及从域名中提取ip的方法
这种方法为从urlparse模块中通过urlparse方法提取url通过hostname属性获取当前url的域名。
此方法是通过urllib模块中splittype方法先从url中获取到proto协议及rest结果,然后通过splithost从rest中获取到host及rest结果,此时host为域名。(rest被分割了两次)如下图:
此方法为从sokcet模块中获取到gethostbyname方法将域名传递进去就能解析出域名的ip。
此方法为通过nslookup获取域名的ip。
以上从域名中提取ip会不准确,需要设置DNS服务器,这样解析域名就准确了。
❻ 使用python获取网站域名信息
功能:使用python获取网站域名信息
适用版本Python2 or Python3:模块python-whois
安装包地址:https://pypi.python.org/pypi/python-whois
教程地址:https://bitbucket.org/richardpenman/pywhois
安装:pip install python-whois
卸载:pip uninstall python-whois
使用方式:
❼ python正则怎么提取域名
import rec='sdsdaherf=sadasdada sdad123,21312!!!' pattern=re.compile('herf=(.*)') pattern.findall(c) a=re.findall('herf=(.*)', c) a 结果就是 Out[9]: ['sadasdada sdad123,21312!!!']
❽ python如何从网页中提取列表中字典中的域名
假设那个字典叫dict:
if dict.has_key( line[0] ):
print dict[ line[0] ]
和列表一样,用[ ]即可
❾ python 获取域名是泛域名还是实际域名
使用urllib.parse.urlparse(url).hostname获取域名,通过socket.gethostbyname(域名)获取IP地址,再通过socket.gethostbyaddr(ip地址就可以得到)真实的hostname了。 代码示例 python3.x: import urllib.parseimport socketurl = '你要获取的网...