前言
《编写高质量python代码的59个有效方法》这本书分类逐条地介绍了编写python代码的有效思路和方法,对理解python和提高编程效率有一定的帮助。本笔记简要整理其中的重要方法。
1. 用pythonic方式来思考(掌握python思想)
遵循PEP8 风格
PEP: (Python Enhancement Proposal #8)
类别|备注|test
编号 | 类别 | 要求 |
---|---|---|
1 | 空格 | 每行字符数不超过79 |
2 | 命名 | 函数、变量及属性用小写字母拼写,下划线连接:lowercase_underscore |
3 | 命名 | 类与异常 单词首字母大写形式: CapitalizedWord |
4 | 表达式与语句 | 使用if not somelist来检测空列表;而非使用检测长度的方法(if len(somelist)==0),空值会自动判定为False |
5 | 表达式与语句 | import 语句按顺序划分成三个部分:标准库模型、第三方模块及自用模块,每个部分按字母顺序排列 |
自动检查代码是否符合PEP8风格:PyLint
编码差异: Bytes、str 与 unicode
Python3和2都存在两种表示字符序列的类型:Python3中是bytes 和 str, Bytes为字符最原始的8位值表示(二进制表示);str则是unicode字符;
2种形式的转换就是一个编解码的过程:
str unicode字符-->二进制,即编码;
二进制 -- > unicode,即解码;
# Python3
def to_str(bytes_or_str):
if isinstance(bytes_or_str,bytes):
value=bytes_or_str.decode('utf-8')
else:
value=bytes_or_str
return value
def to_bytes(bytes_or_str):
if isinstance(bytes_or_str,str):
value=bytes_or_str.encode('utf-8')
else:
value=bytes_or_str
return value
理解了bytes/ str /unicode的区别,有助于我们在编程中理解出现的关于编码的bug
以上图为例,python3中文件读写,open函数默认编码为utf-8,写入的内容默认为str,所以直接写入bytes会报错。当我们改成而二进制方式读写就可以:
切片操作,不要同时指定start、end、stride
切片操作可以指定范围和步进值(stride),从而实现一些效果:(somelist[start:end:stride])
使用stride=-1可以简洁地实现字符串反转。同一操作中,同时使用start、end 和stride会造成代码比较难懂。使用列表推导代替 map 和filter
python中可以根据一个列表来生成另一个列表,称为list comprehension列表推导。
a=[_ for _ in range(1,11)]
s=[x*2 for x in a]
print(s)
s=map(lambda x : x**2,a)
s
列表推导可以直接获取一个list实例,而map返回一个map对象,还需要lambda函数来创建;
ss=[x*2 for x in a if x%2 == 0]
ss=map(lambda x : x**2,filter(lambda x : x%2==0,a))
ss
当需要有条件筛选时,列表推导可以借助简单的表达式实现,而map和filter需要联合使用,才能达到相同的效果;
此外,字典和集合,也具有类似的推导机制
ranks={chr(ord('a')+_):_ for _ in range(5)}
ranks
#: {'a': 0, 'b': 1, 'c': 2, 'd': 3, 'e': 4}
利用生成器表达式
列表推导中,当输入数据比较多时,会消耗大量内存,这种情况下可以使用生成器表达式,其是对列表推导和生成器的一种泛化,返回一个迭代器(Iterator),把列表推导放入圆括号中,就构成生成器表达式:
[_ for _ in range(1,11)]
#: <generator object <genexpr> at 0x7f4c8f1e5f50>
可以使用迭代器的方式对数据进行遍历/利用
while True:
try:
print (next(a))
except StopIteration:
break
for x in a :
print(x)
使用enumerate函数
内置的enumerate函数可以将迭代器包装为生成器,每次产生一对输出值使用zip函数同时遍历两个迭代器
name=[chr(ord('a')+_) for _ in range(5)]
value=[_ for _ in range(5)]
for _n,_v in zip(name,value):
print(_n,_v)
a 0
b 1
c 2
d 3
e 4
当两个数组长度不同时,迭代器会提前结束,只要有一个数据遍历结束,zip就不再产生元组;可以使用itertools内置模块中的zip_longest函数来解决这种问题。
合理利用try/except/else/finally 结构中的每个代码块
finally
finally模块无论是否发生异常都会执行,常用来确保文件句柄能够安全地关闭掉由于finally模块的特殊性,尽量在该模块不要使用return,会引起额外的问题。
else块
try/except/else结构可以清晰地描述哪些异常会由自己的代码处理,如果try模块没有异常,就继续执行else结构;发生异常则执行except块。
网友评论