如下所示:
p1 = r\'(?<=<div class=\"ds_cr\">)(.*?)(?=<div id=\"pageurl\">)\' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下: p1 = r\'(?<=<div class=\"ds_cr\">)([\\s\\S]*?)(?=<div id=\"pageurl\">)\' # 这是我们写的正则表达式规则,你现在可以不理解啥意思
[\\s\\S]
\\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \\f\\n\\r\\t\\v]。
\\S
匹配任何非空白字符。等价于[^ \\f\\n\\r\\t\\v]。
以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
继续阅读与本文标签相同的文章
上一篇 :
【天池直播】同济梁教授运筹学系列直播二--列生成
下一篇 :
大数据相关总结(待续)
-
阿里云服务器计算型实例c5 适合中大型网站及外贸主题网站使用
2026-05-18栏目: 教程
-
Java工程师入门区块链的7个开源项目
2026-05-18栏目: 教程
-
这一团糟的代码,真的是我写的?!
2026-05-18栏目: 教程
-
Cassandra全球使用的公司及场景
2026-05-18栏目: 教程
-
如何创建云数据库RDS?
2026-05-18栏目: 教程
