mongodb的基本使用

作者: 高金01 | 来源:发表于2018-09-29 11:21 被阅读0次

Mongodb 02-CURD
MongoDB基本使用
MongoDB基本使用
Mongodb基本使用
Mongodb 基本使用
mongoDB 基本使用
MongoDB基本使用
MongoDB基本使用
mongodb基本使用
MongoDB的基本使用

本文章属于爬虫入门到精通系统教程第十讲

在之前我们讲解了如何爬取网页（不管是异步加载的还是普通的），但是爬取下来的数据该如何保存呢？

保存到文本文件？

可能有人会说那我保存在文本文件里面，这样也是可以的，但是到你需要用这个数据的时候，可能就会很麻烦了...

image

我今天爬取了10000部日本电影

假如说你要找苍老师出演的，那么你可能会说，我直接ctrl+f查找"苍老师"不就行了

但是假如你想要找"苍老师+无码"怎么办呢？？？

这个时候就是体现数据库的作用了。

Mongodb的介绍

为什么用mongodb呢？

文档结构的存储方式
简单讲就是可以直接存json,list
不要事先定义"表",随时可以创建
"表"中的数据长度可以不一样
也就是第一条记录有10个值，第二条记录不要规定也要10个值
对爬虫这种很乱的数据来说，很适用。

Mongodb的安装

直接到 https://www.mongodb.com/download-center#community选择合适的版本下载安装就可以了。

安装完成后

windows用户在
bin目录下新建一个data的文件夹

image

然后在新建一个start.bat文件,内容写上
mongod --dbpath ./data
后面每次只要直接打开这个.bat 文件mongodb就运行了

image
你可以直接选中start.bat，发送到桌面快捷方式，这样你以后可以直接在桌面打开了

image

mongodb的基本使用

首先 pip install pymongo

image

总结

爬虫经常用到的三条插入语句

下面的test2为表名,

test2.insert_one(xx) 插入一条数据
test2.insert_many(xx) 插入list
最常用>>>test2.update_one({'x':1},{'$set':{'x':3}},upsert=True)
第三条一般会在防止重复的数据被存到数据库内要用到

代码都在 https://github.com/kimg1234/pachong/blob/master/mongodb%E7%9A%84%E5%9F%BA%E6%9C%AC%E4%BD%BF%E7%94%A8.ipynb

参考文档

网友评论

本文标题：mongodb的基本使用

本文链接：https://www.haomeiwen.com/subject/jlpvoftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

mongodb的基本使用

保存到文本文件？

Mongodb的介绍

为什么用mongodb呢？

Mongodb的安装

mongodb的基本使用

总结

爬虫经常用到的三条插入语句

相关文章

Mongodb 02-CURD

MongoDB基本使用

MongoDB基本使用

Mongodb基本使用

Mongodb 基本使用

mongoDB 基本使用

MongoDB基本使用

MongoDB基本使用

mongodb基本使用

MongoDB的基本使用

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读