美文网首页Python编程基础与实践
读书笔记(1): 编写高质量python代码的59个有效方法

读书笔记(1): 编写高质量python代码的59个有效方法

作者: 阿瑟_TJRS | 来源:发表于2020-09-07 16:21 被阅读0次

    前言

    《编写高质量python代码的59个有效方法》这本书分类逐条地介绍了编写python代码的有效思路和方法,对理解python和提高编程效率有一定的帮助。本笔记简要整理其中的重要方法。

    1. 用pythonic方式来思考(掌握python思想)

    遵循PEP8 风格

    PEP: (Python Enhancement Proposal #8)
    类别|备注|test

    编号 类别 要求
    1 空格 每行字符数不超过79
    2 命名 函数、变量及属性用小写字母拼写,下划线连接:lowercase_underscore
    3 命名 类与异常 单词首字母大写形式: CapitalizedWord
    4 表达式与语句 使用if not somelist来检测空列表;而非使用检测长度的方法(if len(somelist)==0),空值会自动判定为False
    5 表达式与语句 import 语句按顺序划分成三个部分:标准库模型、第三方模块及自用模块,每个部分按字母顺序排列

    自动检查代码是否符合PEP8风格:PyLint

    编码差异: Bytes、str 与 unicode

    Python3和2都存在两种表示字符序列的类型:Python3中是bytes 和 str, Bytes为字符最原始的8位值表示(二进制表示);str则是unicode字符;

    2种形式的转换就是一个编解码的过程:
    str unicode字符-->二进制,即编码;
    二进制 -- > unicode,即解码;

    # Python3
    
    def to_str(bytes_or_str):
        if isinstance(bytes_or_str,bytes):
            value=bytes_or_str.decode('utf-8')
        else:
            value=bytes_or_str
        return value
    
    def to_bytes(bytes_or_str):
        if isinstance(bytes_or_str,str):
            value=bytes_or_str.encode('utf-8')
        else:
            value=bytes_or_str
        return value
    
    理解了bytes/ str /unicode的区别,有助于我们在编程中理解出现的关于编码的bug 以上图为例,python3中文件读写,open函数默认编码为utf-8,写入的内容默认为str,所以直接写入bytes会报错。当我们改成而二进制方式读写就可以:

    切片操作,不要同时指定start、end、stride

    切片操作可以指定范围和步进值(stride),从而实现一些效果:(somelist[start:end:stride]

    使用stride=-1可以简洁地实现字符串反转。同一操作中,同时使用start、end 和stride会造成代码比较难懂。

    使用列表推导代替 map 和filter

    python中可以根据一个列表来生成另一个列表,称为list comprehension列表推导。

    a=[_ for _ in range(1,11)]
    s=[x*2 for x in a]
    print(s)
    s=map(lambda x : x**2,a)
    s
    

    列表推导可以直接获取一个list实例,而map返回一个map对象,还需要lambda函数来创建;

    ss=[x*2 for x in a if x%2 == 0]
    ss=map(lambda x : x**2,filter(lambda x : x%2==0,a))
    ss
    

    当需要有条件筛选时,列表推导可以借助简单的表达式实现,而map和filter需要联合使用,才能达到相同的效果;

    此外,字典和集合,也具有类似的推导机制

    ranks={chr(ord('a')+_):_ for _ in range(5)}
    ranks
    #: {'a': 0, 'b': 1, 'c': 2, 'd': 3, 'e': 4}
    

    利用生成器表达式

    列表推导中,当输入数据比较多时,会消耗大量内存,这种情况下可以使用生成器表达式,其是对列表推导和生成器的一种泛化,返回一个迭代器(Iterator),把列表推导放入圆括号中,就构成生成器表达式:

    [_ for _ in range(1,11)]
    #: <generator object <genexpr> at 0x7f4c8f1e5f50>
    

    可以使用迭代器的方式对数据进行遍历/利用

    while True: 
        try:
            print (next(a))
        except StopIteration:
            break
    
    for x in a :
        print(x)
    

    使用enumerate函数

    内置的enumerate函数可以将迭代器包装为生成器,每次产生一对输出值

    使用zip函数同时遍历两个迭代器

    name=[chr(ord('a')+_) for _ in range(5)]
    value=[_ for _ in range(5)]
    for _n,_v in zip(name,value):
        print(_n,_v)
    a 0
    b 1
    c 2
    d 3
    e 4
    

    当两个数组长度不同时,迭代器会提前结束,只要有一个数据遍历结束,zip就不再产生元组;可以使用itertools内置模块中的zip_longest函数来解决这种问题。

    合理利用try/except/else/finally 结构中的每个代码块

    finally

    finally模块无论是否发生异常都会执行,常用来确保文件句柄能够安全地关闭掉

    由于finally模块的特殊性,尽量在该模块不要使用return,会引起额外的问题。

    else块

    try/except/else结构可以清晰地描述哪些异常会由自己的代码处理,如果try模块没有异常,就继续执行else结构;发生异常则执行except块。

    混合使用

    相关文章

      网友评论

        本文标题:读书笔记(1): 编写高质量python代码的59个有效方法

        本文链接:https://www.haomeiwen.com/subject/djpkektx.html