美文网首页
mongodb的基本使用

mongodb的基本使用

作者: 高金01 | 来源:发表于2018-09-29 11:21 被阅读0次

本文章属于爬虫入门到精通系统教程第十讲

在之前我们讲解了如何爬取网页(不管是异步加载的还是普通的),但是爬取下来的数据该如何保存呢?

保存到文本文件?

可能有人会说那我保存在文本文件里面,这样也是可以的,但是到你需要用这个数据的时候,可能就会很麻烦了...

image

我今天爬取了10000部日本电影

假如说你要找苍老师出演的,那么你可能会说,我直接ctrl+f查找"苍老师"不就行了

但是假如你想要找"苍老师+无码"怎么办呢???

这个时候就是体现数据库的作用了。

Mongodb的介绍

为什么用mongodb呢?

  1. 文档结构的存储方式
  2. 简单讲就是可以直接存json,list
  3. 不要事先定义"表",随时可以创建
  4. "表"中的数据长度可以不一样
  5. 也就是第一条记录有10个值,第二条记录不要规定也要10个值
  6. 对爬虫这种很乱的数据来说,很适用 。

Mongodb的安装

直接到 https://www.mongodb.com/download-center#community选择合适的版本下载安装就可以了。

安装完成后

windows用户在
bin目录下新建一个data的文件夹

image

然后在新建一个start.bat文件,内容写上
mongod --dbpath ./data
后面每次只要直接打开这个.bat 文件mongodb就运行了

image
你可以直接选中start.bat,发送到桌面快捷方式,这样你以后可以直接在桌面打开了
image

mongodb的基本使用

首先 pip install pymongo

image
image
image
image
image
image
image

总结

爬虫经常用到的三条插入语句

下面的test2为表名,

  • test2.insert_one(xx) 插入一条数据
  • test2.insert_many(xx) 插入list
  • 最常用>>>test2.update_one({'x':1},{'$set':{'x':3}},upsert=True)
  • 第三条一般会在防止重复的数据被存到数据库内 要用到

代码都在 https://github.com/kimg1234/pachong/blob/master/mongodb%E7%9A%84%E5%9F%BA%E6%9C%AC%E4%BD%BF%E7%94%A8.ipynb

参考文档

相关文章

  • Mongodb 02-CURD

    ===========mongodb =========== mongodb的基本使用 案列需求 存放文章评论的数...

  • MongoDB基本使用

    数据写入与查询 数据更新 数据删除 创建索引

  • MongoDB基本使用

    本文不想文绉绉的去分析MongoDB内部的数据存储结构,只是想单纯的从用的方面给大家一些指导,也不能说是指导,也是...

  • Mongodb基本使用

    启动服务:./bin/mongodb-3.2.10/bin/mongod -f conf/mongod.conf ...

  • Mongodb 基本使用

    例如:现在有数据库 ·

  • mongoDB 基本使用

    数据库帐号的创建与使用 参考不知博客官方说明 数据的备份还原 数据导入与导出 数据导出 注意: 导出类型为json...

  • MongoDB基本使用

    MongoDB基本概念 数据库(database) 数据库是一个仓库,在仓库中存放集合。 集合(collectio...

  • MongoDB基本使用

    成功启动MongoDB后,再打开一个命令行窗口输入mongo,就可以进行数据库的一些操作。 输入help可以看到基...

  • mongodb基本使用

    mongodb MongoDB是专为可扩展性,高性能和高可用性而设计的数据库。它可以从单服务器部署扩展到大型、复杂...

  • MongoDB的基本使用

    一、MongoDB的简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提...

网友评论

      本文标题:mongodb的基本使用

      本文链接:https://www.haomeiwen.com/subject/jlpvoftx.html