5.简单python爬虫——爬取新闻页

#python爬虫实例   爬取新闻#爬取新浪新闻首页中所有的新闻，爬到本地（http://news.sina.com.cn/）#实现过程，先爬首页，通过正则表达式获取所有新闻链接，然后依次爬各新闻，并存储到本地import urllib.requestimport redata=urllib.request.urlopen("http://news.sina.com.cn/").read()data2=data.decode("utf-8","ignore")pat='href="(http://news.sina.com.cn/.*?)"'allurl=re.compile(pat).findall(data2)for i in range(0,10):    try:        print("第"+str(i)+"次爬取")        thisurl=allurl[i]        file="/Users/xubin/myapp/pythonfile/sina/"+str(i)+".html"        urllib.request.urlretrieve(thisurl,file)        print("------成功-------")    except urllib.error.URLError as e:        if hasattr(e,"code"):            print(e.code)        if hasattr(e,"reason"):            print(e.reason)

继续阅读与本文标签相同的文章

None

4.python爬虫浏览器伪装技术

python常用算法

收藏打印

5.简单python爬虫——爬取新闻页

浏览：599 2026-05-24

继续阅读与本文标签相同的文章

4.python爬虫浏览器伪装技术

python常用算法

特别推荐 2026年05月25日星期一

精彩发现

热门标签

5.简单python爬虫——爬取新闻页

浏览：599 2026-05-24

继续阅读与本文标签相同的文章

2026-05-25栏目： 教程

2026-05-25栏目： 教程

2026-05-25栏目： 教程

2026-05-25栏目： 教程

2026-05-25栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-24栏目： 教程

特别推荐 2026年05月25日 星期一

精彩发现

热门标签

相关文章

255人阅读

1542人阅读

414人阅读

2026-05-25栏目：教程

2026-05-25栏目：教程

2026-05-25栏目：教程

2026-05-25栏目：教程

2026-05-25栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-24栏目：教程

特别推荐 2026年05月25日星期一