美文网首页
利用python抓取图片

利用python抓取图片

作者: iOS收藏家 | 来源:发表于2016-07-22 13:47 被阅读63次

    本人使用的Mac 自带python 使用python --version 可以查看python的版本信息

    安装pipsudo easy_install pip

    安装BeautifulSoup sudo pip install BeautifulSoup

    然后再桌面创建一个search.py文件 在此之前我还创建了一个search的文件夹用来存储图片
    下面是我写的python文件

    #!/usr/bin/python
    #-*- coding: utf-8 -*-
    #encoding=utf-8
    
    import urllib2
    import urllib
    import os
    from BeautifulSoup import BeautifulSoup
    
    def getAllImageLink():
        html = urllib2.urlopen('http://www.ugirls.com/Index/Search/Magazine-48.html').read()#网页地址
        soup = BeautifulSoup(html)
        
        liResult = soup.findAll('ul',attrs={"class":"latest_list"})#获取class是latest_list 的ul
        numberIndex = 0
        file_Object = open('/Users/cc/Desktop/search/search.txt','w+')#打开文件进行写操作
        for ul in liResult:
            imageEntityArray = ul.findAll('img')#找到img标签
            for image in imageEntityArray:
                link = image.get('data-original')#图片地址
                imageName = 'image' + str(numberIndex)#随便生成方法名
                numberIndex = numberIndex + 1
                filesavepath = '/Users/cc/Desktop/search/%s.jpg' % imageName#保存地址
                file_Object.write('{"src"'+':"'+link+'"}\n')#每行按照字典形式写入文件
                urllib.urlretrieve(link,filesavepath)#直接下载远程数据到本地
                print filesavepath
        file_Object.close();#关闭文件
    
    def sayHello():#定义函数
        file_Object = open('/Users/cc/Desktop/search/search.txt','r')#打开文件 进行读取
        while True:
            line = file_Object.readline()#按行读取
            if line:
                dic = eval(line)#转化为字典
                print dic['src']#打印字典中的key 对应的值
                pass
            else:
                break
        file_Object.close()
    
    if __name__ == '__main__':
        getAllImageLink()#调用getAllImageLink函数
        sayHello()#调用sayHello() 函数
    

    然后利用终端输入命令python search.py就可以运行了下面是我运行后的截图:

    Search.png

    相关文章

      网友评论

          本文标题:利用python抓取图片

          本文链接:https://www.haomeiwen.com/subject/wpjijttx.html