美文网首页
2020-03-29 xpath的使用

2020-03-29 xpath的使用

作者: f5423d3134f0 | 来源:发表于2020-03-29 13:51 被阅读0次
    #导入库
    import requests
    from fake_useragent import UserAgent
    from lxml import etree
    #创建url
    url = "http://www.shuhai.com/top/"
    #创建标头
    headers = {
        "UserAgent": UserAgent().chrome
    }
    #请求
    response = requests.get(url, headers=headers)
    #响应 获取页面信息
    e = etree.HTML(response.text)
    #通过xpath获取指定信息的内容
    names = e.xpath(
        "//div[@class='book-item noborder']//div[@class='flex']//a[contains(@href,'http://www.shuhai.com/book/')]/text()")
    #把names转成len格式,再迭代names里的内容和数量
    for num in range(len(names)):
        print(num+1,":", names[num])
    

    总结:xpath 在之前 selenium里学习过,所以很容易上手,前面几个就暂时不学习了。
    最后导出后还不会创建文件保存起来。

    相关文章

      网友评论

          本文标题:2020-03-29 xpath的使用

          本文链接:https://www.haomeiwen.com/subject/ksayuhtx.html