爬虫爬取豆瓣top250

爬虫爬取豆瓣top250

作者: David5262 | 来源:发表于2019-11-07 11:57 被阅读0次

Python学习
Python学习
爬虫爬取豆瓣top250
Python爬虫之多线程下载豆瓣Top250电影图片
Python多线程爬虫下载豆瓣Top250电影图片
爬取豆瓣电影top250提取电影分类进行数据分析
node.js一个爬虫实例
用23行代码爬取豆瓣音乐top250
python爬豆瓣电影top250写入excle
静态站虎扑NBA新闻爬取

爬虫爬取豆瓣top250并保存到mongoDB数据库中

import requests
from lxml import etree
import pymongo
import time

class DouBan:
    def getUrl(self,url,):
        try:
            for page in range(10):
                url = 'https://movie.douban.com/top250?start=' + str(page * 25) + '&filter='
                r = requests.get(url)
                r.raise_for_status()
                r.encoding = r.apparent_encoding
                re = etree.HTML(r.text)
                title = re.xpath('//div[@class="hd"]/a/span[@class="title"][1]//text()')
                href = re.xpath('//div[@class="hd"]/a/@href')
                for i in range(len(title)):
                    data1.insert_one({'影名': title[i], '链接': href[i]})
                    time.sleep(0.1)
        except Exception as e:
            print(e)

if __name__ == '__main__':
    # MongoDB的连接
    client = pymongo.MongoClient('localhost', 27017)
    data = client['douban']
    data1 = data['db']
    url = 'https://movie.douban.com/top250'
    douban = DouBan()
    douban.getUrl(url)

相关文章

Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
Python学习
python爬虫(四) python爬虫爬取豆瓣电影数据今天我们爬取一下豆瓣电影TOP250页面电影的数据，依然...
爬虫爬取豆瓣top250
爬虫爬取豆瓣top250并保存到mongoDB数据库中
Python爬虫之多线程下载豆瓣Top250电影图片
爬虫项目介绍本次爬虫项目将爬取豆瓣Top250电影的图片，其网址为：https://movie.douban...
Python多线程爬虫下载豆瓣Top250电影图片
爬虫项目介绍本次爬虫项目将爬取豆瓣Top250电影的图片，其网址为：https://movie.douban.c...
爬取豆瓣电影top250提取电影分类进行数据分析
标签（空格分隔）：python爬虫一、爬取网页，获取需要内容我们今天要爬取的是豆瓣电影top250页面如下所示...
node.js一个爬虫实例
爬取豆瓣top250 测试
用23行代码爬取豆瓣音乐top250
网上有各种爬取豆瓣电影top250的教程，虽然豆瓣音乐top250和豆瓣电影top250的爬取十分类似，但是我大致...
python爬豆瓣电影top250写入excle
网上看了很多python的爬虫都是在爬豆瓣电影top250，心里想着没事也写一个。1.爬取准备：通过查看豆瓣url...
静态站虎扑NBA新闻爬取
爬取豆瓣电影top250的那个爬虫框架爬取静态网站非常好用，今天练习了一下，套用并且对细节进行了一些改进，用来爬取...

网友评论

本文标题：爬虫爬取豆瓣top250

本文链接：https://www.haomeiwen.com/subject/gznmbctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|爬虫爬取豆瓣top250|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！