ImageNet爬虫（python3）

ImageNet是一个图片检索网站，本爬虫基于python3

使用方法：

运行爬虫，在控制终端输入搜索内容，后台会自动从ImageNet上搜索并且把图片下载到imagefiles文件夹，子目录文件夹命名为搜索内容。
$\"在这里插入图片描述\"$
$\"在这里插入图片描述\"$

源代码

import urllib3
import re
import os
import datetime
import random

 Url = \"http://www.image-net.org\"
user_agent = \"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0  \"
headers = {\"User-Agent\" : user_agent}
def search( Name,http):
    global  Url,headers
    searchUrl =  Url + \"/search?q=\" +  Name
    print (searchUrl)    
    imgUrls=[]
    imgUrlList = []
    try:
        content = http.request(\'GET\', searchUrl, headers=headers).data
        pattern = r\'search_result\" border-style=\"none\"><tr><td>.*</table>\'
        searchResult = re.findall(pattern,str(content))
        searchResult = searchResult[0]
        imgUrls = re.findall(r\'<img src=\"([^\"]*)\"\',searchResult)        
        for imgUrl in imgUrls:
            imgUrl =  Url+imgUrl
            imgUrlList.append(imgUrl)
    except:
        print(\"error\")

    return imgUrlList

def mkdir(dirPath):
    dirPath = dirPath.strip()
    if(not os.path.exists(dirPath)):
        os.makedirs(dirPath)
    


def download(imgUrlList,dirPath,http):
    global headers
    print(\"Path:\"+dirPath+\",Downloading\")
    for imgUrl in imgUrlList:
        randomNum=random.randint(0,100)
        nowTime=datetime.datetime.now().strftime(\"%Y%m%d%H%M%S\")
        uniqueNum=str(nowTime)+str(randomNum);        
        fileName = uniqueNum + \".jpg\"
        content = http.request(\'GET\', str(imgUrl),headers=headers).data
        with open(dirPath + \"/\" +fileName,\'wb\') as imageFile:
            imageFile.write(content);
    print(\"All done!\")
    
if __name__ == \"__main__\": 
    http = urllib3.PoolManager(100)
    while True:
        Name = input(\"Search For:\")
       dirPath = \"imagefiles/\" +  Name
       urls = search( Name,http)
       if (len(urls) > 0) :
           mkdir(dirPath)
       download(urls,dirPath,http)

ImageNet爬虫（python3）

浏览：170 2026-05-07

使用方法：

源代码

继续阅读与本文标签相同的文章

第四届中国优秀云计算开源案例评选活动开始

云小蜜智能服务机器人设计逻辑及展望

特别推荐 2026年05月18日星期一

精彩发现

热门标签

ImageNet爬虫（python3）

浏览：170 2026-05-07

使用方法：

源代码

继续阅读与本文标签相同的文章

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-24栏目： 教程

特别推荐 2026年05月18日 星期一

精彩发现

热门标签

相关文章

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-24栏目：教程

特别推荐 2026年05月18日星期一