1. python 檢測一個網址是否為404不存在(網頁不存在)
你可以用Python獲取網頁的狀態碼,拿到狀態碼後面怎麼處理還不就由你了,見下面截圖。
第一種是用urllib模塊:
import urllib
status=urllib.urlopen("http://www..com").code
print status
第二種是用requests模塊:
import requests
code=requests.get("http://www..com").status_code
print code
2. 初學Python網路編程,為什麼安裝示例代碼輸入會返回404呢
稍微改了一下,了解了Http的get發包格式就很容易解決這個問題了。如下代碼自己調整一下,如果編譯不過,可能和python的版本有關。
import socket
mysock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
mysock.connect(('www.py4inf.com', 80))
mysock.send(bytes('GET /code/romeo.txt HTTP/1.0 Host: www.py4inf.com ', encoding='gbk'))
response = b''
while True:
data = mysock.recv(512)
if (len(data) < 1):
break
response += data
print(response.decode())
mysock.close()
3. 新手,用python寫的爬蟲,為什麼出現404
可能是你的header寫的太簡單了,我剛剛也是一直404,因為一開始我的header里只有User-Agent,再加上Accept,Accept-Encoding,Content-Type,Host,Origin,Proxy-Connection,Referer,Upgrade-Insecure-Requests就行了,這些都可以從chrome的開發者工具里直接看,或者用fiddler等工具看。