美文网首页
marshmallow 库介绍

marshmallow 库介绍

作者: guoweikuang | 来源:发表于2019-09-26 21:18 被阅读0次

    前言

    又是一个忘了写完的。。。。

    marshmallow 是一个 ORM/ODM/框架无关的库,用于将复杂的数据类型,例如对象与Python原生数据类型之间转换的库。简单而言,就是对象序列化和反序列化,实现object -> dict, object -> list, string -> dict, string -> list的转换。(注:这篇文章将以 0.1.0 版本代码分析,可能与当前官方文档的例子有些不同)

    官网示例

    from datetime import date
    from marshmallow import Schema, fields, pprint
    
    class ArtistSchema(Schema):
        name = fields.Str()
    
    class AlbumSchema(Schema):
        title = fields.Str()
        release_date = fields.Date()
        artist = fields.Nested(ArtistSchema())
    
    bowie = dict(name='David Bowie')
    album = dict(artist=bowie, title='Hunky Dory', release_date=date(1971, 12, 17))
    
    schema = AlbumSchema()
    result = schema.dump(album)
    pprint(result, indent=2)
    # { 'artist': {'name': 'David Bowie'},
    #   'release_date': '1971-12-17',
    #   'title': 'Hunky Dory'}
    

    源码开篇

    先看看 0.1.0 版本的源码结构,如下所示

    marshmallow
    ├── __init__.py  
    ├── base.py
    ├── compat.py
    ├── core.py   # 核心代码,使用Python元类定义了Serializer,继承于BaseSerializer、SerializerMeta
    ├── exceptions.py
    ├── fields.py
    ├── types.py
    

    core.py

    先从 core.py 文件开始看起,该文件中主要包括了以下几个类,并应用了元类编程的思想:

    class SerializerMeta(type):
        def __new__(cls, name, bases, attrs):
            attrs['_base_fields'] = _get_declared_fields(bases, attrs)
            return super(SerializerMeta, cls).__new__(cls, name, bases, attrs)
        
    class BaseSerializer(object):
        def __init__(self, data=None):
            self._data = data
            self.fields = self.__get_fields()  # Dict of fields
        
        def __get_fields(self):
            """"""
            
        @property
        def data(self):
            """"""
        
        @property
        def json(self):
            """"""
            
    class Serializer(with_metaclass(SerializerMeta, BaseSerializer)):
        pass
    
    
    # compat.py
    def with_metaclass(meta, *bases):
        '''Defines a metaclass.
    
        Creates a dummy class with a dummy metaclass. When subclassed, the dummy
        metaclass is used, which has a constructor that instantiates a
        new class from the original parent. This ensures that the dummy class and
        dummy metaclass are not in the inheritance tree.
    
        Credit to Armin Ronacher.
        '''
        class metaclass(meta):
            __call__ = type.__call__
            __init__ = type.__init__
            def __new__(cls, name, this_bases, d):
                if this_bases is None:
                    return type.__new__(cls, name, (), d)
                return meta(name, bases, d)
        return metaclass('temporary_class', None, {})
    

    可能之前有过元编程经验的人就会发现这段代码很熟悉,Serializer 类定义时使用 with_metaclass 方法传入 SerializerMeta 元类和 BaseSerializer 基类,而 with_metaclass 是一个比较重要的方法,用来兼容 python2 和 python3 元类使用上的区别。

    • with_metaclass 函数中定义了一个内部类(metaclass),并使用该内部类创建一个临时类 temporary_class
    • 该临时类是 内部类(metaclass) 的实例(元类创建出来的类就是元类的实例), 即是 tempoary_class 类的元类是 metaclass
    • 通过上面代码可以看出临时类创建时仅仅调用了 type.__new__方法

    当定义 Serializer 类的时候,Serializer 得到了继承的元类metaclass:

    • 实例化 metaclass, 调用 metaclass.__new__方法,即是调用 meta(name, bases, d), meta 就是 SerializerMeta 元类,bases 就是 BaseSerializer 基类(要继承的类)
    • 调用 SerializerMeta 元类的 __new__ 方法来实例化得到 Serializer

    这个地方需要注意一点是:

    1、在定义 Serializer 类的时候,会执行 SerializerMeta 元类的__new__ 来创建类,而不是实例化的时候执行__new__ ,这是因为在类的定义(创建)过程中,是通过寻找 __metaclass__ 来完成的
    2、上面虽然没有显示定义 __metaclass__ ,但由于下面metaclass的规则,会将定义的 SerializerMeta 类作为 metaclass 来创建类
    
    3、metaclass 查找的规则是:如果当前类没有__metaclass__,但有基类,那么就使用第一个基类的__class__作为 __metaclass__,如果没有 __class__,则使用type 来创建类
    

    一个简单的例子来看看:

    # -*- coding: utf-8 -*-
    from datetime import datetime
    from marshmallow import Serializer, fields
    
    class Person(object):
        def __init__(self, name):
            self.name = name
            self.date_born = datetime.now()
            
    class PersonSerializer(Serializer):
        name = fields.String()
        date_born = fields.DateTime()
        
    person = Person(name="guoweikuang")
    serialized = PersonSerializer(person)
    print(PersonSerializer.__mro__)
    
    
    # out: (<class '__main__.PersonSerializer'>, <class 'marshmallow.core.Serializer'>, <class 'marshmallow.core.BaseSerializer'>, <type 'object'>)
    

    可以看到 PersonSerializer 继承链中没有之前创建的临时类(tempoary_class)

    相关文章

      网友评论

          本文标题:marshmallow 库介绍

          本文链接:https://www.haomeiwen.com/subject/sbxeuctx.html