美文网首页
猫眼电影Top100数据爬取,使用requests和xpath

猫眼电影Top100数据爬取,使用requests和xpath

作者: 和菜头编程 | 来源:发表于2021-06-07 23:35 被阅读0次

    记录一下学习python爬虫的入门例子

    1、爬取的网页源代码如下:

    2、代码部分如下,只爬取了电影名字,如果要爬取其他数据,可以自行补上

    import requests

    from lxmlimport etree

    url='https://maoyan.com/board/4'

    headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

    req=requests.get(url=url,headers=headers)

    print(req.text)

    tree=etree.HTML(req.text)

    #爬取第一个电影的名字

    element=tree.xpath('//dl[@class="board-wrapper"]/dd[1]//p[@class="name"]/a/@title')

    print(element)

    #爬取第一页的所有电影名称

    name=tree.xpath('//p[@class="name"]/a/@title')

    print(name)

    声明:本代码仅用于个人学习,不用于商业用途

    相关文章

      网友评论

          本文标题:猫眼电影Top100数据爬取,使用requests和xpath

          本文链接:https://www.haomeiwen.com/subject/dbgnehtx.html