美文网首页
读一读我——无废话Python(六)使用切片

读一读我——无废话Python(六)使用切片

作者: du1dume | 来源:发表于2020-05-27 05:06 被阅读0次

    切片可以说是 Python 中最重要的特性之一。比如内建的 list,tuple,str 类型全都支持切片操作。而且,切片也是一些著名第三方库的基础,比如 NumPy,Pandas,TensorFlow 和 scikit-learn。因此,要想成为一名合格的 Python 程序员,切片是必会项目。

    切片的使用公式如下:

    a[start:stop:step]

    基础不讲了。这里只总结规律:

    1. 如果 start >= stop 并且 step 是正数,那么将返回值为空。
    2. 如果 stop 大于要截取的序列的长度,返回值为从 start 开始一直到最后一个元素(包含最后一个元素)。
    3. 如果 step 是正数,start 为第一个元素,stop 为最后一个元素,返回值肯定包含第一个元素和最后一个元素。
    4. 如果 step < 0,start 和 stop 都为默认值,返回值肯定包含第一个元素和最后一个元素;如果 stop 不为默认值,返回值肯定不包含 stop 对应的索引。

    下面我们来看看如何用切片解决问题。假设有一段文本,给你一个字符串,让你返回一段文本,该文本包含该字符串以及该字符串的前 20 个字符和后 20 个字符。

    d = '''
    Life is a chess-board The chess-board is the world: the pieces are the phenomena of the universe; the rules of the game are what we call the laws of nature. The player on the other side is hidden from us. We know that his play is always fair, just and patient. But also we know, to our cost, that he c overlooks a mistake, or makes the smallest allowance for ignorance.
    '''
    
    find_str = lambda txt, str: txt[txt.find(str)-20:txt.find(str)+20] if str in txt else -1
    print(find_str(d, 'smallest')) # stake, or makes the smallest allowance f
    

    查找字符串我们使用的是 in 操作符,查找索引我们用的是 Python 内建的 find 函数,它会返回该字符串首字母索引。根据问题描述,切片的 start 和 stop分别为减 20 和加 20。

    当然这段程序有个明显的缺点,就是调用了两次 find 函数,但如果使用临时变量就无法让程序如此简洁了。有没有既简洁又高效的办法?有。你可以先思考一下,我们以后再说。

    下面我们来看个列表解析和切片组合使用的例子。

    假设我们有一个 4 行 6 列的二维数组,用作机器学习的训练数据。但我们的机器太菜,6 个特征已经不堪重负,需要缩减特征数到 3 个。解决方案如下:

    data = [
      [1.1, 1.2, 1.3, 1.4, 1.5, 1.6],
      [2.1, 2.2, 2.3, 2.4, 2.5, 2.6],
      [3.1, 3.2, 3.3, 3.4, 3.5, 3.6],
      [4.1, 4.2, 4.3, 4.4, 4.5, 4.6]
    ]
    
    result = [line[::2] for line in data]
    
    print(result) # [[1.1, 1.3, 1.5], [2.1, 2.3, 2.5], [3.1, 3.3, 3.5], [4.1, 4.3, 4.5]]
    

    我们的解决方案分两步走。首先利用列表解析从数据中取出每一行数据作为新 list 的元素(还是一个 list,包含 6 个元素);其次,我们利用切片,对这个取出来的含有 6 个元素的 list 做操作,以步长为 2 的方式把 6 个数据缩减到了 3 个数据。

    最后,让我们来看看切片的另一个强大特性,slice assignment,中文就叫切片赋值好了。

    什么是切片赋值?简单的说就是切片操作放在了等号的左边。

    s1[::] = s2[::]

    它表达的含义是什么?更简单,就是用 s2 的返回值覆盖 s1 的返回值。来看代码:

    # 怪异的数据
    data = [
      "a", "1", "b", "2",
      "c", "3", "d", "4",
      "e", "5", "f", "6"
    ]
    
    # 需求是:把数字替换成它前面的字母
    data[1::2] = data[::2]
    
    print(data) # ['a', 'a', 'b', 'b', 'c', 'c', 'd', 'd', 'e', 'e', 'f', 'f']
    

    说实话,在不知道切片赋值之前,我是用循环做的,真的是一名不合格的 Python 程序员。我们来稍稍解释一下。等号左边切片的返回值为:["1", "2", ...],等号右边切片的返回值为:["a", "b", ...]。

    请关注公众号“读一读我”。

    相关文章

      网友评论

          本文标题:读一读我——无废话Python(六)使用切片

          本文链接:https://www.haomeiwen.com/subject/nkhiahtx.html