❶ python一段小函數解釋
一般我們常見的網址後綴(suffix)是 cn,或者net,或者com,你說的就是域名的後綴列表
後面代碼就是用dot把域名分隔開,
比如www..com 被拆分成[ 『www','','com']
經過for循環後,到com的時候,進入if分支,而前面走的是else分支,所以可以看到sdomain的變化如下:
遇到www, sdomain包含['www']
遇到 sdomain被替換為['']
遇到com,走if分支,append,變成 ['','com']
然後join後就變成 .com
不過不知道這么些的理由,要是我,就用正則表達式,或者直接保留後面兩個部分
domain=url.split('.')
if domain[-1] in suffixs:
return string.join(domain[-2:],'.')
else:
return None #not valid domain
❷ 有沒有可以像百度爬蟲一樣的python程序。把中國所有域名都採集保存下來。希望有大哥可以給我一份,
你表達的不是很清楚!
採集域名有啥用?
你是說採集每個正常運行的域名下的網站內容嗎?
但我得告訴,這個程序很多,搜索引擎很多人都寫過!但你得有硬體成本才行啊!中國啊,多少個網站!你如果你用單台電腦採集,估計你的從現在開始到你老死還採集不完!網路的伺服器數量已經數以萬計,懂嗎?
如果你只採集幾個特定的網站,還可以搞的定啊
❸ python如何去除字元串後面的日期,只留下域名
你好,由於日期長度固定,或者說格式固定,因此可以利用一些已有函數刪除每個字元串後面的指定長度的字元或者格式。可以了解一下re正則表達式和python提供的String庫或者其他庫。找到兩篇文章,希望對你有所幫助。
python刪除字元串中指定字元的方法
python 字元串 去除 特定位置字元
如果有幫助的話,希望給個採納,謝謝啦。
❹ python怎麼批量查詢域名備案信息
1.把要反查的ip地址寫在c:\ip.txt裡面,每個ip或者域名一行
2.python reverse_ip.py
3.用Excel打開c:\result.csv,結果就都在裡面了!
❺ Python獲取url中域名及從域名中提取ip的方法
這種方法為從urlparse模塊中通過urlparse方法提取url通過hostname屬性獲取當前url的域名。
此方法是通過urllib模塊中splittype方法先從url中獲取到proto協議及rest結果,然後通過splithost從rest中獲取到host及rest結果,此時host為域名。(rest被分割了兩次)如下圖:
此方法為從sokcet模塊中獲取到gethostbyname方法將域名傳遞進去就能解析出域名的ip。
此方法為通過nslookup獲取域名的ip。
以上從域名中提取ip會不準確,需要設置DNS伺服器,這樣解析域名就准確了。
❻ 使用python獲取網站域名信息
功能:使用python獲取網站域名信息
適用版本Python2 or Python3:模塊python-whois
安裝包地址:https://pypi.python.org/pypi/python-whois
教程地址:https://bitbucket.org/richardpenman/pywhois
安裝:pip install python-whois
卸載:pip uninstall python-whois
使用方式:
❼ python正則怎麼提取域名
import rec='sdsdaherf=sadasdada sdad123,21312!!!' pattern=re.compile('herf=(.*)') pattern.findall(c) a=re.findall('herf=(.*)', c) a 結果就是 Out[9]: ['sadasdada sdad123,21312!!!']
❽ python如何從網頁中提取列表中字典中的域名
假設那個字典叫dict:
if dict.has_key( line[0] ):
print dict[ line[0] ]
和列表一樣,用[ ]即可
❾ python 獲取域名是泛域名還是實際域名
使用urllib.parse.urlparse(url).hostname獲取域名,通過socket.gethostbyname(域名)獲取IP地址,再通過socket.gethostbyaddr(ip地址就可以得到)真實的hostname了。 代碼示例 python3.x: import urllib.parseimport socketurl = '你要獲取的網...