美文网首页
2018-05-08

2018-05-08

作者: 小龙1992 | 来源:发表于2018-05-08 15:22 被阅读0次

    # 1:首先对保存有网页源码的文件进行读取;

    # 2:利用正则表达式取出所有图片的连接;

    # 3:然后通过遍历将所有的连接再通过创建协程进行多任务下载;

    # 4:最后将下载的图片保存在桌面上建好的文件夹里面;

    import re

    import gevent

    from geventimport monkey

    monkey.patch_all()

    import urllib.request


     def download(img_name,url):    

            rep = urllib.request.urlopen(url)

            img_content = rep.read()

            f =open("C:\\Users\\lenovo\\Desktop\\long\\" + img_name,"wb")   #保存到桌面上创建的文件夹

            f.write(img_content)

            print("正在下载中,请耐心等待")

            f.close()

    def main():

    # 1:首先对保存有网页源码的文件进行读取;

           file =open("C:\\Users\\lenovo\\Desktop\\11.txt","r")

           content = file.read()

    # 2:利用正则表达式取出所有图片的连接;

        #https: // rpic.douyucdn.cn / live - cover / appCovers / 2018 / 04 / 03 / 1975380_20180403232127_big.jpg

            urls = re.findall(r"https://.+\.jpg",content)

    # 3:然后通过遍历将所有的连接再通过创建协程进行多任务下载;

             i =0

            url_list = []

            for  url   in  urls:

                url_list.append(gevent.spawn(download,"%s.jpg" % i,url))

                i +=1

                gevent.joinall(url_list)

    if __name__ =='__main__':

    main()

    相关文章

      网友评论

          本文标题:2018-05-08

          本文链接:https://www.haomeiwen.com/subject/dsqwrftx.html