猫眼电影Top100数据爬取，使用requests和xpath

作者: 和菜头编程 | 来源:发表于2021-06-07 23:35 被阅读0次

记录一下学习python爬虫的入门例子

1、爬取的网页源代码如下：

2、代码部分如下，只爬取了电影名字，如果要爬取其他数据，可以自行补上：

import requests

from lxmlimport etree

url='https://maoyan.com/board/4'

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

req=requests.get(url=url,headers=headers)

print(req.text)

tree=etree.HTML(req.text)

#爬取第一个电影的名字

element=tree.xpath('//dl[@class="board-wrapper"]/dd[1]//p[@class="name"]/a/@title')

print(element)

#爬取第一页的所有电影名称

name=tree.xpath('//p[@class="name"]/a/@title')

print(name)

声明：本代码仅用于个人学习，不用于商业用途

本文标题：猫眼电影Top100数据爬取，使用requests和xpath

本文链接：https://www.haomeiwen.com/subject/dbgnehtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！