用pythonic方式思考
- 确认使用的python的版本, 优先使用python3
- 遵守PEP8风格, 保护属性_leading_underscore, 私有属性__double_leading_underscore, 类与异常CapitalWord, 模块级别的变量ALL_CAPS。 不要通过len(somelist)来判断somelist是否非空, 而是if (not) somelist.
- python3: bytes(原始8bit值), str(Unicode); python2: str(原始8bit值), unicode(Unicode). 通过encode/decode('utf-8')可以来统一编码, 以“中文” 为例, encode就是系统码(b'\xe4\xb8\xad\xe6\x96\x87'), decode就是用户可识别码(你好). 另外, 在python中, 读写文件统一采用模式('wb', 'rb')。
- 辅助函数代替复杂的表达式,简洁
- 切片操作
- [start:end:stride]是另外一种灵活的处理list的方式, 但是若正负值混用的话可能造成困扰, itertools中的islide不允许start, end, stride为负值, 若有需求可以采用
- 用list comprehension代替map, filter等操作, 如[x**2 for x in list]
- 不要使用两个以上的list comprehension
- 用生成器, 如果数据大的话。 其实就是[]改成()这样就变成generator了,
- 用enumerate代替range, 使得代码更加简洁, 其中, 可以指定enumerate开始的index, 如enumerate(list, 1), 则index是从1开始计数的
- 用zip同时遍历两个迭代器, 但是zip(a, b) 若其中一个已经耗尽的话, 就停止了, 可以改成itertools中的zip_longest来代替(izip_longest in python2)
- 不要再for/while后面写else
- 合理使用try/except/else/finally. try: finally: 可以用finally来关闭文件, 因为它一定会被执行。 try: except: else: 用except来检测异常, 若通过了try, else块也会被执行, 这样可以减少try语块那里的代码量。 终极用法就是try: except: else: finally.
函数
- 尽量返回Exception而不是None, 因为在python的if判断中None, 0, '', [] 可能都是等价的。
- 如何在闭包(closure)中使用外围作用域的变量: nonlocal 尽量避免这种用法
- 使用generator代替result list, 代码更加简洁, 使用更少的内存
- generator是有状态的, 调用一轮之后就会遇到StopIterationException, 一种方法是不用iter, 而是iter(), 如用sum(iter())代替sum(iter), 这样就是产生新的generator而不是原来的generator了。另外一种是建立一个类, 定义iter方法, 这也是可迭代的。
- 使用*args接受变长的输入
- 使用关键字参数(如a=9)来表达可选的行为, 并且记住不要以位置参数的行为给它赋值, 如函数foo(a, b=9), 若调用的时候b要重新赋值,不要用foo(1, 2) 这种形式, 而应该是foo(1, b=2)。
- 使用None表示具有动态默认值的参数, 并且用docstring描述其行为。 如def log(message, when=datatime.now())的话when只在程序运行的时候会被加载一次, 导致其之后的值都是一样的, 合理的做法是def log(message, when=None)来描述其行为。 同理def decode(data, default=None)也是。
- 用只能以关键字指定的参数保证代码清晰, 如def safe_division_c(number, divisor, ignore_overflow=False, ignore_zero_division=False). 这个函数在python3可以做如下的改进def safe_division_c(number, divisor, *, ignore_overflow=False, ignore_zero_division=False), 通过加一个*, 使得函数的调用者必须指定ignore_overflow, ignore_zero_division的值, 保证了调用者清楚明确这个函数的功能。(*的功能是, 在其之前的参数可以用位置参数赋值, 在之后的参数只能用关键字参数赋值)。 而在python2中, 只能用**这种数量可变的关键字参数来达到上述的功能, def safe_division_d(number, divisor, **kwargs):
ignore_overflow = kwargs.pop(‘ignore_overflow’, False)
ignore_zero_div = kwargs.pop(‘ignore_zero_division’, False)
if kwargs:
raise TypeError(‘Unexpected **kwargs: %r’ % kwargs)
类与继承
- 尽量使用辅助类来维护程序状态而不是字典和元组。 另外collections的namedtuple可以定义精简不可变的数据类, 如Point = namedtuple("Point", ("x", "y")). 实例化的时候可以是p = Point(1, 2), 这样很简洁。
- 对python简单的接口来说, 应该直接传入函数就好, 而不是传入类的实例, 通过类的call方法, 类可以像函数一样得到调用。尽量用带call的函数来保存状态, 而不是闭包里面的nonlocal变量
- @classmethod多态的构建对象. 它是通过类层面来构建的, 方法是def method(cls, xx), 而不是类通常的self, 优点是与构造器init相仿, 但不用重复的创建实例来产生数据, 子类都继承了它, 使主类更加的generic。
- 使用super()来继承父类, 若直接调用父类的init方法可造成程序混乱。
- 尽量避免多重继承, 使用mix-in
- 多用public, 少用private(_), 使用protected()即可。
- 类其实都可以算是容器, 因此类也可以继承list, tuple, set, dictionary以获得这些容器的功能。编写自己的容器的时候可以从collections.abc模块继承相应的抽象基类, 确保我们的类具有适当的接口及行为。
网友评论