美文网首页
Xpath网上批量下载

Xpath网上批量下载

作者: Davis_hang | 来源:发表于2018-10-18 19:48 被阅读0次

import os import urllib.request from lxml import etree #下载数据 def download_img(src_list, name_list): dir_path="./bf-girl" for i in range(len(name_list)): #截取后缀名 suffix=os.path.splitext(src_list[i])[-1] #得到图片全路径 file_path=os.path.join(dir_path,name_list[i]+suffix) try: #下载 urllib.request.urlretrieve(src_list[i],file_path) print("%s---download finsh" %file_path) except Exception as e: print("%s---file missing!" % file_path) #发送请求并获取响应数据以及通过Xpath解析数据 def get_data(req): #发起请求 res=urllib.request.urlopen(req) html=res.read().decode("utf-8") html_etree=etree.HTML(html) src_list= html_etree.xpath("//div[@id='container']/div/div/a/img/@src2") name_list = html_etree.xpath("//div[@id='container']/div/div/a/img/@alt") # print(len(src_list)) download_img(src_list,name_list) #构建请求对象 def build_req(url): headers ={ 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36' } req = urllib.request.Request(url=url,headers=headers) return req def main(): start_page=int(input("请输入起始页码:")) end_page = int(input("请输入结束页码:")) #临时地址 tem_url = "http://sc.chinaz.com/tupian/rentixiezhen" for page in range(start_page,end_page+1): if page != 1: url = tem_url+"_"+str(page)+".html" else: url = tem_url+".html" req=build_req(url) get_data(req) if __name__ == "__main__": main()

相关文章

  • Xpath网上批量下载

    import osimport urllib.requestfrom lxml import etree#下载数据...

  • 如何使用xpath

    + 使用爬虫,比较重要的一步是解析网页,Xpath是一个非常好的工具 + 可以在谷歌的网上商店里面下载Xpath ...

  • python爬虫-XPath实例——批量下载高清壁纸

    一、前言 网络爬虫的一般步骤: 1.获取网页 2.提取网页信息 3.保存网页信息 要用到的Python库: req...

  • python爬虫系列之 html页面解析:如何写 xpath路径

    一、前言 上一节我们讲了怎么批量下载壁纸,虽然爬虫的代码很简单,但是却有一个很重要的问题,那就是 xpath路径应...

  • 六、唧唧down

    专门下载B站视频,支持超清画质批量下载,支持弹幕批量下载。 目前好像不能批量下ASS弹幕文件,可以先选择批量下载X...

  • TCGA相关分析

    1、批量下载 TCGAbiolinks批量下载 2、生存分析 R下载并计算生存

  • R语言如何批量下载图片

    微信公众号选择封面时,由于我没有大量的图片,每次现去网上下载几张图片很麻烦,所以搜索网上教材,找到批量下载的代码,...

  • python爬虫系列之 xpath实战:批量下载壁纸

    一、前言 在开始写爬虫之前,我们先了解一下爬虫 首先,我们需要知道爬虫是什么,这里直接引用百度百科的定义 网络爬虫...

  • 本周工作总结

    本周主要在做听书最近播放的存储批量管理功能,我的下载UI,选择下载音频UI,音频的批量下载批量管理,关联下载状态,...

  • 利用R包TCGAbiolinks进行各种数据下载

    下载TCGA数据的方法有很多,上一篇介绍了如何用gdc-client批量下载数据,基于网上有很多用TCGAbiol...

网友评论

      本文标题:Xpath网上批量下载

      本文链接:https://www.haomeiwen.com/subject/ytnszftx.html