美文网首页python
Python爬虫 -- 抓取电影天堂8分以上电影

Python爬虫 -- 抓取电影天堂8分以上电影

作者: 9ba4bd5525b9 | 来源:发表于2019-05-24 15:35 被阅读64次

爬虫的入口从分页的列表开始,比如美剧的列表第一页地址这样: http://www.ygdy8.net/html/gndy/oumei/list_7_1.html,第二页是http://www.ygdy8.net/html/gndy/oumei/list_7_2.html,是有规律的,所以就可以遍历所有的页面,分别抓取每页里面的影视资源,再进入每条电影的详情页面,抓取出下载地址,存到文件里。

技术上用的是requests 和 BeautifulSoup两个模块。

具体做法是,先从电影列表中定位每条资源中的IMDB(b)评分大于8分的资源,并且将结果放入movie对象中。

其中的getDownloanLink(url)是进入电影详情页获取下载链接。

然后是将电影信息存入到文件data.txt中。

经过上面的步骤,即可将某一页的电影资源抓取到,并且存入文件中。

程序的主入口,遍历列表即可。目前他们只有155页,就限制这么多页码。

相关文章

网友评论

    本文标题:Python爬虫 -- 抓取电影天堂8分以上电影

    本文链接:https://www.haomeiwen.com/subject/uaagzqtx.html