Effective Python 学习笔记 1
PEP 8规范
命名
- 使用下标获取列表元素、调用函数或者给关键字参数赋值时,不在两旁加空格
- 函数、变量及属性应该用小写字母来拼写,个单词之间下划线相连
- 受保护实例属性以单个下划线开头:
_protect_var
- 类与异常,以每个单词首字母大写形式命名:
ClassName
- 模块级别的常量,采用全部大写字母方式命名,单词之间下划线连接:
ALL_CAPS
- 类中实例方法(
instance method
),应该把首个参数命名为self
,以表示该对象自身 - 类方法(
class method
)的首个参数应该命名为cls
,以表示该类自身
语句
- 不要不要通过检测长度的办法(如
if len(somelist) == 0
)来判断somelist
是否为[]
或''
等空值,而是采用if not somelist
这种写法来判断,它会假定:空值将自动评估为false
- 不要编写单行的
if
、for
、while
及except
语句,应该分开书写以示清晰 -
import
语句应总是放在开头 - 引入模块时,总是使用绝对名称,而不是根据当前面模块路径来使用相对名称:
from bar import foo
- 如果一定要引用相对名称,采用
from . import foo
的格式 -
import
语句应该按顺序划分成三个部分,分别表示标准库模块
、第三方模块
以及自用模块
,在每个部分中import
语句应该按照模块的字母顺序排列
bytes、str与unicode的区别
-
把
Unicode
字符转换成二进制数据
就必须使用encode
方法 -
把
二进制数据
字符转换成Unicode
就必须使用decode
方法 -
实现:
def to_str(bytes_or_str): if isinstance(bytes_or_str, bytes): value = bytes_or_str.decode('utf-8') else: value = bytes_or_str return value def to_bytes(str_to_bytes): if isinstance(str_to_bytes, str): value = str_to_bytes.encode('utf-8') else: value = str_to_bytes return value
-
编写程序时,一定要把编码和解码操作放在界面外围来做。程序最核心的部分应该使用
Unicode
字符类型,而且不对编码做任何假设。这种方法既可以令程序接受多种类型的文本编码(如Latin-1
、Shift JIS
和Big 5
),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8
) -
open
函数添加了名为encoding
的新参数,默认值为utf-8
,这就要求再写入时必须传入unicode
字符的str
实例,而不接受二进制数据的bytes
实例。解决方法:采用字符写入模式wb
,读取采用rb,如:with open('file.txt', 'wb') as f: f.write(os.urandom(10))
用辅助函数取代复杂的表达式
'''
eg. 需求:查询字符串
'''
from urllib.parse import parse_qs
my_values = parse_qs('red=5&blue=0&green=', keep_blank_values=True)
print(repr(my_values))
>>> {'red': ['5'], 'blue': ['0'], 'green': ['']}
# 方法一:用get方法在my_values字典中查询不同参数
print('RED: ', my_values.get('red'))
print('GREEN: ', my_values.get('green'))
>>> RED: ['5']
GREEN: [''] #无法将空值输出为0
#方法二
green = int(my_values.get('green', [])[0] or 0)
print('GREEN: %r' % green)
>>> GREEN: 0 #表达式复杂,不易理解
# 总结辅助函数
def get_first_int(values, key, default=0):
found = values.get(key, [''])
if found[0]:
found = found[0]
else:
found = default
return found
green = get_first_int(my_values, 'green')
总结
- 用
if/else
表达式会比用or
或and
这样的Boolean
操作符更清晰
了解切割序列的办法
基本写法
somelist[start:end]
- 如果从头切片,将
start
留空,而非写0
.end
同理 - 在源列表进行切割之后,会产生一份全新的列表。系统依然维护着指向原列表中各个对象的引用。
- 在赋值时采用切割操作会改变原列表:
a[2:7] = [1, 2, 3]
- 单词切片操作内不要同时指定
start
、end
和stride
- 反转字符串:```re = str[::-1]
- 第五条只对ASCII字符有效,对已经编码成utf-8字符串的Unicode字符无效
网友评论