在 Python 中,代码不是越多越好,而是越少越好。代码不是越复杂越好,而是越简单越好。
基于这一思想,我们来介绍 Python 中非常有用的高级特性,1 行代码能实现的功能,决不写 5 行代码。请始终牢记,代码越少,开发效率越高。
切片
取一个 list 或 tuple 的部分元素是非常常见的操作。比如,一个 list 如下:
x = ['0', '1', '2', '3', '4']
现在我我要取前三个元素怎么办呢?
马上就能想到的办法:
>>> [x[0], x[1], x[2]]
['0', '1', '2']
稍微思考一下的办法:
>>> r = []
>>> n = 3
>>> for i in range(n):
... r.append(x[i])
...
>>> r
['0', '1', '2']
看了一下 API 后的办法:
>>> x[0:3]
['0', '1', '2']
对这种经常取指定索引范围的操作,用循环十分繁琐,因此,Python 提供了切片(Slice)操作符,能大大简化这种操作。
x[0:3]
表示,从索引0
开始取,直到索引3
为止,但不包括索引3
。即索引0
,1
,2
,正好是 3 个元素。
如果第一个索引是0
,还可以省略:
>>> x[:3]
['0', '1', '2']
也可以从索引 1 开始,取出 2 个元素出来:
>>> x[1:3]
['1', '2']
类似的,既然 Python 支持x[-1]
取倒数第一个元素,那么它同样支持倒数切片,试试:
>>> x[-2:]
['3', '4']
>>> L[-2:-1]
['3']
倒数第一个元素的索引是-1
。
更酷炫的玩法
切片操作十分有用。我们先创建一个 0-99 的数列:
>>> L = list(range(100))
>>> L
[0, 1, 2, 3, ..., 99]
可以通过切片轻松取出某一段数列。比如前 10 个数:
>>> L[:10]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
后 10 个数:
>>> L[-10:]
[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
前 11-20 个数:
>>> L[10:20]
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
前 10 个数,每两个取一个:
>>> L[:10:2]
[0, 2, 4, 6, 8]
所有数,每 5 个取一个:
>>> L[::5]
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
甚至什么都不写,只写[:]
就可以原样复制一个 list:
>>> L[:]
[0, 1, 2, 3, ..., 99]
tuple 也是一种 list,唯一区别是 tuple 不可变。因此,tuple 也可以用切片操作,只是操作的结果仍是 tuple:
>>> (0, 1, 2, 3, 4, 5)[:3]
(0, 1, 2)
字符串'xxx'
也可以看成是一种 list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:
>>> 'ABCDEFG'[:3]
'ABC'
>>> 'ABCDEFG'[::2]
'ACEG'
迭代
我们可以通过for
循环来遍历这个 list 或 tuple,这种遍历我们称为迭代(Iteration)。
在 Python 中,迭代是通过for ... in
来完成的,而很多语言比如 java 语言,迭代 list 是通过下标完成的,比如 Java 代码:
for (i=0; i<list.length; i++) {
n = list[i];
}
可以看出,Python 的for
循环抽象程度要高于 java 的for
循环,因为 Python 的for
循环不仅可以用在 list 或 tuple 上,还可以作用在其他可迭代对象上。
list 这种数据类型虽然有下标,但很多其他数据类型是没有下标的,但是,只要是可迭代对象,无论有无下标,都可以迭代,比如 dict 就可以迭代:
>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> for key in d:
... print(key)
...
a
c
b
因为 dict 的存储不是按照 list 的方式顺序排列,所以,迭代出的结果顺序很可能不一样。
默认情况下,dict 迭代的是 key。如果要迭代 value,可以用for value in d.values()
,如果要同时迭代 key 和 value,可以用for k, v in d.items()
。
由于字符串也是可迭代对象,因此,也可以作用于for
循环:
>>> for ch in '123':
... print(ch)
...
1
2
3
看来在 Python 中有很多可以迭代的对象,可是我们该如何判断一个对象是可迭代对象呢?
Python 也为我们提供了解决办法,可以方法是通过 collections 模块的 Iterable 类型判断:
>>> from collections import Iterable
>>> isinstance('abc', Iterable) # str是否可迭代
True
>>> isinstance([1,2,3], Iterable) # list是否可迭代
True
>>> isinstance(123, Iterable) # 整数是否可迭代
False
就剩一个小问题,如果要对 list 实现类似 Java 那样的下标循环怎么办?
Python 内置的enumerate
函数可以把一个 list 变成索引 - 元素对,这样就可以在for
循环中同时迭代索引和元素本身:
>>> for i, value in enumerate(['A', 'B', 'C']):
... print(i, value)
...
0 A
1 B
2 C
上面的for
循环里,同时引用了两个变量,在 Python 里是很常见的,比如下面的代码:
>>> for x, y in [(1, 1), (2, 4), (3, 9)]:
... print(x, y)
...
1 1
2 4
3 9
列表生成式
列表生成式即 List Comprehensions,是 Python 内置的非常简单却强大的可以用来创建 list 的生成式。
举个例子,要生成 list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
可以用list(range(1, 11))
:
>>> list(range(1, 11))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
但如果要生成[1x1, 2x2, 3x3, ..., 10x10]
怎么做?方法一是循环:
>>> L = []
>>> for x in range(1, 11):
... L.append(x * x)
...
>>> L
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
但是循环太繁琐,而列表生成式则可以用一行语句代替循环生成上面的 list:
>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
for 循环后面还可以加上 if 判断,这样我们就可以筛选出仅偶数的平方:
>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]
还可以使用两层循环,可以生成全排列:
>>> [m + n for m in 'ABC' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
for
循环其实可以同时使用两个甚至多个变量,比如dict
的items()
可以同时迭代 key 和 value:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> for k, v in d.items():
... print(k, '=', v)
...
y = B
x = A
z = C
因此,列表生成式也可以使用两个变量来生成 list:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> [k + '=' + v for k, v in d.items()]
['y=B', 'x=A', 'z=C']
最后把一个 list 中所有的字符串变成小写:
>>> L = ['Hello', 'World', 'IBM', 'Apple']
>>> [s.lower() for s in L]
['hello', 'world', 'ibm', 'apple']
网友评论