Python进阶(二)

作者: 董夕 | 来源:发表于2016-07-03 00:09 被阅读408次

    博客链接:http://inarrater.com/2016/07/03/pythonadvance2/

    这一部分是关于Python的Callable。在Stackoverflow上有一个专门的问题叫做“What is a "callable" in Python”,高票回答中说:

    A callable is anything that can be called.

    这个回答很抽象,大雄从更具体的角度来阐述Callable这个概念——在Python中哪些是callable的?

    • function
    • closure
    • bound method
    • unbound method
    • class method
    • static method
    • functor
    • operator
    • class

    先说答案,很明显,列出的这些都是callable的。这些概念中的大部分我在工作中都有使用,包括比如closure的坑也帮助新同学调试bug的时候看到新入职的同学自己踩到过,但是对于bound methodunbound method这些概念还不是很清晰。我们也一个个来看。

    3. Closure

    Closure,闭包,在Python中本质上是一个函数,或者更具体来说它和Function的区别是它包含了Code和Environment,而Python中Environment又可以分为globals、locals和cells三部分。
    globals和locals比较容易理解,其实就是两个dict,分别保存了全局变量和局部变量,那这个cells是什么?我们先来看一个非常经典的例子:

    def foo():
        logout_lst = []
    
        for i in xrange(5):
            def logout():
                print i
            logout_lst.append(logout)
    
        for l in logout_lst:
            l()
    
    foo()
    

    思考:这段代码的输出是什么?

    分析一下这段代码,虽然这里为了方便演示,构造了一个只有print的逻辑,你可能会质疑它的作用,但是在我们开发的过程中,就有同学在循环内部定义了类似的闭包用于引擎回调的调用,引用了外部了一个类似i的变量。例子中,在foo的函数内部,代码def logout()定义了一个闭包(写到这里让我想起了遥远的过去写JAVA代码时使用的Inner Class),然后我们想使用外部变量i的值,这里只是把它输出出来,通常我们想要输出的结果是打印0、1、2、3、4这几个数字,当然中间有换行,但是最终的输出结果是什么呢?
    5个4!
    为什么呢?我们来添加一些输出日志来查看一下,为了方便看输出,我们只循环两次来看,修改后的代码如下:

    def foo():
        logout_lst = []
    
        for i in xrange(2):
            def logout():
                print "i:", i, id(i)
                print "globals:", globals()
                print "locals:", locals()
            logout_lst.append(logout)
    
        for l in logout_lst:
            l()
            print "Cells:", l.__closure__, id(l.__closure__[0].cell_contents)
            print ''
    
    foo()
    

    输出的结果如下:

    i: 1 35882616
    globals: {'__builtins__': <module '__builtin__' (built-in)>, '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x022C72B0>, '__doc__': None}
    locals: {'i': 1}
    Cells: (<cell at 0x02354570: int object at 0x02238678>,) 35882616
    
    i: 1 35882616
    globals: {'__builtins__': <module '__builtin__' (built-in)>, '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x022C72B0>, '__doc__': None}
    locals: {'i': 1}
    Cells: (<cell at 0x02354570: int object at 0x02238678>,) 35882616
    

    首先打印一下i的值与i这个变量的id,你可以认为这是i在Python虚拟机中的唯一编号,两次输出它的值都是1,id也都是一个35882616,然后输出一下globals和locals看一下,这两个很简单,不做分析了。最后通过__closure属性来看下闭包的内容:

    Cells: (<cell at 0x02354570: int object at 0x02238678>,)
    

    这就是前面说的cells,它是一个cell对象,里面的内容有一个int对象,通过cell_contents属性可以查看到它的id是35882616,和i是一样的。
    可以看出,cells就是对于up-values的引用(references)注意引用
    那之前的输出就很容易理解了,引用,当后面调用闭包执行的时候,i变量值已经变成了4,那输出i自然每次都是4。
    最后,如何修改可以让你的代码可以按照之前的计划正常执行呢?很简单,不要直接使用cells中的值,而是用一个参数来让它变成参数,就是定义这个闭包的时刻的值了。

    def foo():
        logout_lst = []
    
        for i in xrange(2):
            def logout(x = i):
                print "x:", x, id(x)
                print "globals:", globals()
                print "locals:", locals()
            logout_lst.append(logout)
    
        for l in logout_lst:
            l()
            print "Cells:", l.__closure__
            print ''
    
    foo()
    

    输出结果:

    x: 0 37062276
    globals: {'__builtins__': <module '__builtin__' (built-in)>, '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x023E72B0>, '__doc__': None}
    locals: {'x': 0}
    Cells: None
    
    x: 1 37062264
    globals: {'__builtins__': <module '__builtin__' (built-in)>, '__file__': 'F:\\David\\narrator.py', '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x023E72B0>, '__doc__': None}
    locals: {'x': 1}
    Cells: None
    

    此处,cells的内容变为了None,输出的结果也是0和1,它们的id自然也不同。其实参数也可以写成def logout(i = i):,内部可以使用i,但是这会造成一些困扰,个人不推荐这么写。

    思考:那么你以为这个坑就踩完了吗?有没有哪里还可能存在问题?

    def logout(x = i):这种定义虽然用在闭包里,但是其实是函数的默认参数,那么默认参数如果使用list、dict或者python object等这样mutable的值会怎样?这自然是另外一个入门级的坑:

    背景: 不建议在函数默认参数中使用mutable value,而保证只使用immutable value。

    但有时候为了解决一个坑,可能不小心踩入另外一个坑。如果这里使用了,比如一个list对象作为参数,那么创建出来的这几个闭包中的x都引用的会是同一个对象,而且,在任何一个闭包多次调用的时候,x的值都是同一个对象的引用。如果像例子中是只读的逻辑的话,可能没有问题,如果后面有人添加了修改的逻辑,那就呵呵呵呵了。可能会乱成一锅粥,出现各种神奇的现象,写这样逻辑的人自求多福吧。

    总结:理解闭包的概念,理解引用的概念,编写代码保持思路清晰,明确自己使用的变量存在在哪里,是一件非常非常重要的事情,对团队开发中避免匪夷所思令人抓狂的Bug很有帮助!

    这一部分只讲闭包这一个点,其实关于闭包还有很多知识点,有兴趣的可以自己查阅相关资料。第三部分讲解bound method和unbound method,这是我这次课程最喜欢的部分。

    PS: 很多坑,你看过文章介绍,或者听同事讲过,但是写代码的时候有时还是会由于当时思路的混乱而饶进去,重新踩一遍,这往往难以避免,不亲身经历的坑思维上很难那么敏感。经验学习和知识积累的作用,是让你从坑中往外爬的时候更快一些,回头看那些坑印象更深刻一些。

    2016年7月2日于杭州网易大厦

    相关文章

      网友评论

        本文标题:Python进阶(二)

        本文链接:https://www.haomeiwen.com/subject/jmnqjttx.html