爬虫框架scrapy和数据库MongoDB的结合使用（二）实战

爬虫框架scrapy和数据库MongoDB的结合使用（二）实战

作者: JRlu | 来源:发表于2016-09-22 15:37 被阅读361次

成人网站PornHub爬虫分享(一天可爬取500万以上的视频)
利用Python爬取500万以上的国产自拍小电影哦！
小电影网站Python爬虫，一天可爬取500万以上的国产自拍视频
利用Python爬取500万以上的国产自拍小电影哦！
Scrapy-Redis分布式爬取链家上海17个区房源信息（二）
爬虫框架scrapy和数据库MongoDB的结合使用（二）实战
python自动化爬取地名的gps信息！
一、用Scrapy框架开发爬虫
python爬虫框架Scrapy
还在考虑去哪找小视频？Python爬虫带你爬取数百万部国产小视频

目标抓取盗墓笔记小说网站上《盗墓笔记》这本书的书名、章节名、章节url，并存放到MongoDB中

1.Scrapy中settings.py的设置（先scrapy startproject novelspider）

在settings.py中配置MongoDB的IP地址、端口号、数据记录名称，并通过settings.py使pipelines.py生效：

2.Scrapy中item.py设置

3.Scarpy中pipelines.py的设置

在pipelines中可以像普通的python文件操作MongoDB一样编写代码出来需要保持到MongoDB中的数据，然而不同的是这里的数据来自items，这样做的好处是将数据抓取和处理分开。

在通过settings导入MONGODB字典时竟然报错了~~~~（玛德），所示格式错误，不明所以，故mongodb的设置直接写到pipelines中。把spider抓取到的数据存放到item实例中，再通过dict字典化insert到mongodb中。

4.spider文件下新建novspider.py

5.运行爬虫

有两种方法运行，一种是直接在cmd下输入 scrapy crawl xxxspider，当然你得先cd到xxxspider文件夹下；

另一种是在xxxspider文件夹下（和scrapy.cfg同一个目录下）建立一个mian.py脚本，其内容为：

6.运行结果

刷新mongodb，我存放到mydb3中：

8.源码

我分享到了百度云盘：链接：http://pan.baidu.com/s/1dFjxViD 密码：a8m7

可能会失效，有需要的M我~~~~ 谢谢大家支持,荆轲刺秦王！

相关文章

成人网站PornHub爬虫分享(一天可爬取500万以上的视频)
来自公众号 : DeveloperPython 声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不...
利用Python爬取500万以上的国产自拍小电影哦！
声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不可使用于商业和个人其他意图。若使用不当，均由个人...
小电影网站Python爬虫，一天可爬取500万以上的国产自拍视频
声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不可使用于商业和个人其他意图。若使用不当，均由个人...
利用Python爬取500万以上的国产自拍小电影哦！
声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不可使用于商业和个人其他意图。若使用不当，均由个人...
Scrapy-Redis分布式爬取链家上海17个区房源信息（二）
免责声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不可使用于商业和个人其他意图。若使用不当，均由...
爬虫框架scrapy和数据库MongoDB的结合使用（二）实战
目标抓取盗墓笔记小说网站上《盗墓笔记》这本书的书名、章节名、章节url，并存放到MongoDB中 1.Scrap...
python自动化爬取地名的gps信息！
知识点： 1、python 2、scrapy爬虫框架+mongodb数据库 3、http://www.gpsspg...
一、用Scrapy框架开发爬虫
用Scrapy框架做一个爬虫，将结果保存到MongoDB 本文用Scrapy框架实现一个爬虫的例子，Scrapy的...
python爬虫框架Scrapy
爬虫框架Scrapy(二) 使用框架Scrapy开发一个爬虫只需要四步：创建项目：scrapy startproj...
还在考虑去哪找小视频？Python爬虫带你爬取数百万部国产小视频
郑重声明：本项目旨在学习Scrapy爬虫框架和MongoDB数据库，不可用于其他不正当的事情与商业。若使用不当产生...

网友评论

本文标题：爬虫框架scrapy和数据库MongoDB的结合使用（二）实战

本文链接：https://www.haomeiwen.com/subject/dofwettx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|爬虫框架scrapy和数据库MongoDB的结合使用（二）实战|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！