浅谈Python采集网页时正则表达式匹配换行符的问题

如下所示：

p1 = r\'(?<=<div class=\"ds_cr\">)(.*?)(?=<div id=\"pageurl\">)\' #这样采集html时出错，采集不到数据，正则中 . 是不能匹配换行符，改成如下：
p1 = r\'(?<=<div class=\"ds_cr\">)([\\s\\S]*?)(?=<div id=\"pageurl\">)\' # 这是我们写的正则表达式规则，你现在可以不理解啥意思

[\\s\\S]

\\s

匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \\f\\n\\r\\t\\v]。

\\S

匹配任何非空白字符。等价于[^ \\f\\n\\r\\t\\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

继续阅读与本文标签相同的文章

无标签

【天池直播】同济梁教授运筹学系列直播二--列生成

大数据相关总结（待续）

收藏打印

浅谈Python采集网页时正则表达式匹配换行符的问题

浏览：1564 2026-05-08

继续阅读与本文标签相同的文章

【天池直播】同济梁教授运筹学系列直播二--列生成

大数据相关总结（待续）

特别推荐 2026年05月18日星期一

精彩发现

热门标签

浅谈Python采集网页时正则表达式匹配换行符的问题

浏览：1564 2026-05-08

继续阅读与本文标签相同的文章

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-24栏目： 教程

特别推荐 2026年05月18日 星期一

精彩发现

热门标签

相关文章

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-24栏目：教程

特别推荐 2026年05月18日星期一