Python+Mongodb 案例解析

作者: tianmh | 来源:发表于2015-12-06 09:51 被阅读14115次

本教程适合于mongodb的创建/查询/和基本的案例操作

注：未经许可不得转载

一、配置和安装相应的环境

主要针对python脚本操作mongdb数据库，所以安装pymongo和mongodb库。安装教程请谷歌；

二、创建连接到mongodb数据库：

与PyMongo工作时，第一步是建立一个MongoClient到正在运行的mongod实例。

>>>from pymongo import MongoClient

>>>client = MongoClient('localhost', 27017)#比较常用

>>># client = MongoClient('mongodb://localhost:27017/')使用MongoDB的URI格式

创建常见的方式有两种：一种是连接到默认的主机端口；另外一种是指定主机和固定的端口，注意一般mongodb安装时默认的端口为：27017。

三、创建数据库

MongoDB中的单个实例可以支持多个独立的数据库。当PyMongo工作访问使用上MongoClient实例属性的风格访问数据库：例如创建一个test_database数据库。

>>>db = client.test_database

>>># db = client['test-database']或者这种形式

>>>#test_database数据库的名称

四、获取集合(getting a collection)

集合是一组存储在MongoDB中的文件，并且可以被认为是一个表，作为大致在关系数据库中的等效的。获得在PyMongo收集工作与获取数据库：

>>>collection = db.test_collection

>>># collection = db['test-collection']或者这种形式

有关集合(和数据库)在MongoDB中一个重要的注意的是：当第一个文件被插入到他们集合和数据库时集合就被创建。

五、文件

MongoDB中的数据是使用JSON风格的文件代表（和存储）。在PyMongo我们用字典来代表文件。作为一个例子，下面的字典可能被用来代表一个博客帖子，下面以一个例子来说明文件的写入mongodb的过程：

文件的内如如下：

>>> import datetime

>>> post = {"author": "Mike",

..."text":"My first blog post!",

..."tags":["mongodb", "python", "pymongo"],

..."date":datetime.datetime.utcnow()}

Note：请注意，文档可以包含原生的Python类型（如datetime.datetime实例），它会自动转换，并从相应的BSON类型。

5.1文件的插入

若要将文档转换为集合，可以使用insert_one()函数进行：

>>> posts = db.posts

>>> post_id = posts.insert_one(post).inserted_id

>>> post_id

Out[5]: ObjectId('56556b3c9d00010b2f8909cf')

当一个文件被插入一个特殊的键，“_id”，自动添加如果文档没有包含一个“_id”键。“_id”的值必须在这个集合是唯一的。insert_one()返回InsertOneResult的一个实例。有关“_id”的更多信息，请参见_id的文档。

插入第一个文档后，该帖收集实际上已在服务器上创建。我们可以通过列出所有在我们的数据库中收集的验证这一点：

>>> db.collection_names(include_system_collections=False)

Out[6]: [u'posts']

5.2单个文档的获取find_one()

查询最基本的类型，可以在MongoDB中进行的find_one()。该方法返回一个单一的文件匹配查询(或无，如果没有匹配)，当你知道只有一个匹配的文件，或者只关心在第一文件匹配是非常有用的，使用find_one()来获得职位收集的头文件：

In [7]: posts.find_one()

Out[7]:

{u'_id': ObjectId('565583369d00010c0ad19cd6'),

u'author': u'Mike',

u'date': datetime.datetime(2015,11, 25, 9, 45, 22, 80000),

u'tags': [u'mongodb', u'python',u'pymongo'],

u'text': u'My first blog post!'}

Note：上面的结果是一个辞典匹配，先前插入的那个。返回文档中包含一个“_id”，这是在插入自动添加。

如果尝试用不同的author，如“Eliot”会得到任何结果：

In [8]: posts.find_one({"author": "Eliot"})

没有结果；

如果尝试，“Mike”会得到如下结果：

In [9]: posts.find_one({"author": "Mike"})

Out[9]:

{u'_id': ObjectId('565583369d00010c0ad19cd6'),

u'author': u'Mike',

u'date': datetime.datetime(2015,11, 25, 9, 45, 22, 80000),

u'tags': [u'mongodb', u'python',u'pymongo'],

u'text': u'My first blog post!'}

5.3通过ObjectId查询

我们也可以找到一个位置由它的_id，这在我们的例子中是一个的ObjectId：

In [10]: post_id

Out[10]: ObjectId('565583369d00010c0ad19cd6')

In [11]: posts.find_one({"_id": post_id})

Out[11]:

{u'_id': ObjectId('565583369d00010c0ad19cd6'),

u'author': u'Mike',

u'date': datetime.datetime(2015,11, 25, 9, 45, 22, 80000),

u'tags': [u'mongodb', u'python',u'pymongo'],

u'text': u'My first blog post!'}

注意，一个ObjectId存在不一样的字符串表示：

In [13]: post_id_as_str = str(post_id)

posts.find_one({"_id":post_id_as_str}) #

没有任何结果

在Web应用程序中的一个常见的任务是让从请求URL中的ObjectId，并找到匹配的文件。有必要在这种情况下将它传递到find_one()之前从字符串转换的ObjectId：

from bson.objectid import ObjectId

# The web framework gets post_id from the URL and passes it as a string

def get(post_id):

# Convert from string toObjectId:

document =client.db.collection.find_one({'_id': ObjectId(post_id)})

5.4 批量插入(Bulk Inserts)

除了插入一个单一的文件，我们也可以执行批量插入操作，通过传递列表作为第一个参数insert_many（）。这将插入每个文件在列表中，只发送一个命令到服务器：

In [14]:

new_posts = [{"author": "Mike",

"text": "Anotherpost",

"tags":["bulk", "insert"],

"date":datetime.datetime(2009, 11, 12, 11, 14)},

{"author":"Eliot",

"title": "MongoDB isfun",

"text":"and pretty easy too!",

"date":datetime.datetime(2009, 11, 10, 10, 45)}]

result = posts.insert_many(new_posts)

result.inserted_ids

Out[14]:

[ObjectId('565589029d00010c0ad19cd7'), ObjectId('565589029d00010c0ad19cd8')]

Note:有几个有趣的事情需要注意这个例子：

l从insert_many()，结果返回两个的ObjectId，而且每一个都插入到了文件。

lnew_posts [ 1 ]都有不同的“tags”比其他位置-没有“标签”栏，我们增加了一个新的类，“title”。从这可以看出MongoDB的构架是自由化的，可以自行增加和删减；

5.5 多文档查询

为了获得更多的比一个单一的文件，因为我们使用find()方法查询的结果。find()返回游标实例，它允许我们遍历所有匹配的文件。例如，我们可以遍历的数据库收集每一份文件：

In [16]:

for post in posts.find():

print post

{u'date': datetime.datetime(2015, 11, 25, 9, 45, 22, 80000), u'text':u'My first blog post!', u'_id': ObjectId('565583369d00010c0ad19cd6'),u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}

{u'date': datetime.datetime(2009, 11, 12, 11, 14), u'text': u'Anotherpost', u'_id': ObjectId('565589029d00010c0ad19cd7'), u'author': u'Mike',u'tags': [u'bulk', u'insert']}

{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'andpretty easy too!', u'_id': ObjectId('565589029d00010c0ad19cd8'), u'author':u'Eliot', u'title': u'MongoDB is fun'}

就像我们用find_one()一样，我们可以通过find()来限制文档的返回结果。在这里，我们得到它的作者是“Mike”只有那些文件：

In [17]: for post in posts.find({"author":"Mike"}):

print post

{u'date':datetime.datetime(2015, 11, 25, 9, 45, 22, 80000), u'text': u'My first blogpost!', u'_id': ObjectId('565583369d00010c0ad19cd6'), u'author': u'Mike',u'tags': [u'mongodb', u'python', u'pymongo']}

{u'date': datetime.datetime(2009,11, 12, 11, 14), u'text': u'Another post', u'_id':ObjectId('565589029d00010c0ad19cd7'), u'author': u'Mike', u'tags': [u'bulk',u'insert']}

5.6 范围查询

MongoDB的支持许多不同类型的高级查询。作为一个例子，执行我们结果限制的位置早于某个日期，也由作者对结果进行排序的查询：

In [20]:

d = datetime.datetime(2009, 11, 12, 12)

for post in posts.find({"date": {"$lt":d}}).sort("author"):

print post

{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'andpretty easy too!', u'_id': ObjectId('565589029d00010c0ad19cd8'), u'author':u'Eliot', u'title': u'MongoDB is fun'}

{u'date': datetime.datetime(2009, 11, 12, 11, 14), u'text': u'Anotherpost', u'_id': ObjectId('565589029d00010c0ad19cd7'), u'author': u'Mike',u'tags': [u'bulk', u'insert']}

六、简单的统计

如果我们只是想知道有多少文件匹配，我们可以执行查询函数count()。得到所有集合中的文件的计数：

In [18]: posts.count()

Out[18]: 3

或者那些符合特定格式的文件：

In [19]: posts.find({"author": "Mike"}).count()

Out[19]: 2

七、删除文档

可以使用集合的remove()方法从集合中删除一个文档。remove方法和find、find_one一样，也可以使用一个字典参数来指定哪个文档需要被删除。比如，要删除所有"author"键的值为"Mike"的文档，输入：

In [26]: posts.remove({"author": "Mike"})

Out[26]: {u'n': 4, u'ok': 1}

In [27]: for nl in posts.find():

print nl

{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'andpretty easy too!', u'_id': ObjectId('565589029d00010c0ad19cd8'), u'author':u'Eliot', u'title': u'MongoDB is fun'}

{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'andpretty easy too!', u'_id': ObjectId('56559fb89d00010d55ba1d12'), u'author':u'Eliot', u'title': u'MongoDB is fun'}

八、案例解析

8.1常见mongoDB函数的创建集成案例