1. python 检测一个网址是否为404不存在(网页不存在)
你可以用Python获取网页的状态码,拿到状态码后面怎么处理还不就由你了,见下面截图。
第一种是用urllib模块:
import urllib
status=urllib.urlopen("http://www..com").code
print status
第二种是用requests模块:
import requests
code=requests.get("http://www..com").status_code
print code
2. 初学Python网络编程,为什么安装示例代码输入会返回404呢
稍微改了一下,了解了Http的get发包格式就很容易解决这个问题了。如下代码自己调整一下,如果编译不过,可能和python的版本有关。
import socket
mysock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
mysock.connect(('www.py4inf.com', 80))
mysock.send(bytes('GET /code/romeo.txt HTTP/1.0 Host: www.py4inf.com ', encoding='gbk'))
response = b''
while True:
data = mysock.recv(512)
if (len(data) < 1):
break
response += data
print(response.decode())
mysock.close()
3. 新手,用python写的爬虫,为什么出现404
可能是你的header写的太简单了,我刚刚也是一直404,因为一开始我的header里只有User-Agent,再加上Accept,Accept-Encoding,Content-Type,Host,Origin,Proxy-Connection,Referer,Upgrade-Insecure-Requests就行了,这些都可以从chrome的开发者工具里直接看,或者用fiddler等工具看。