#python爬虫的异常处理#爬虫遇到异常时就会直接崩溃停止运行,下次再运行时,又会从头开始。#开发一个具有顽强生命力的爬虫,必须要进行异常处理。#常见状态码以及含义#301 Moved Permanently:重定向到新的URL,永久性#302 Found:重定向到临时的URL,非永久性#304 Not Modified:请求的资源未更新#400 Bad Request:非法请求#401 Unauthorized:请求未经授权#403 Forbidden:禁止访问#404 Not Found:没有找到对应页面#500 Internal Server Error:服务器内部出现错误#501 Not Implemented:服务器不支持实现请求所需要的功能#异常处理的两个类URLError和HTTPError#HTTPError是URLError的子类,HTTPError有异常状态码及异常原因,而URLError没有异常状态码##URLError发生的原因主要有:1.连不上服务器。2.访问的URL不存在。3.没有网络。4.触发了HRRPError子类import urllib.errorimport urllib.requesttry: urllib.request.urlopen("http://blog.csdn.net")except urllib.error.URLError as e: if hasattr(e,"code"): print(e.code) if hasattr((e,"reason")): print(e.reason) 继续阅读与本文标签相同的文章
上一篇 :
Java 内联类初探
下一篇 :
4.python爬虫浏览器伪装技术
-
SEO人员:如何快速诊断竞争对手网站!
2026-05-25栏目: 教程
-
容器Docker学习系列二~权限控制与命令了解
2026-05-25栏目: 教程
-
深度学习并非万能:你需要避免这三个坑
2026-05-25栏目: 教程
-
FAGAN:完全注意力机制(Full Attention)GAN,Self-attention+GAN
2026-05-25栏目: 教程
-
全球智慧城市将达上千个,但66%的人却不想住,为何?
2026-05-25栏目: 教程
