python-基本数据结构

作者: Allenware | 来源:发表于2017-04-09 18:51 被阅读174次

    python为何这么简洁方便

    python非常的简洁,如果用C语言100行才能干的事儿,python只需要10行、5行甚至一行。很重要的一个原因就是python支持的这些高级数据结构,节省了很多代码量。

    List

    列表是python中最常用的数据类型。list是有序的集合,可以随时添加删除元素

    [item1,item2 ...] 语法上是 [] 中的元素组成的有序集合,元素不必是同一类型,List中可以有List元素。

    >>>language=['c','java','python']
    >>>language
    ['c','java','python']
    

    字符串 一样,List同样可以被索引和切片,List也是可迭代对象,不同的是List是可变数据类型。

    常用API

    • list(obj) 将对象强制转成list,比如 list(range(5))
    • list.append(obj) 在列表尾追加 obj
    • list.insert(index,obj) index索引处插入 obj
    • list.pop(obj=list[-1]) 移除列表中的元素(默认最后一个)
    • list.remove(obj) 移除obj匹配的第一个对象
    >>>s=[1,2,3,4,5,[6,7,8],9]
    
    >>>s.append(0)
    [1, 2, 3, 4, 5, [6, 7, 8], 9, 0]
    >>>s.insert(-1,-1)
    [1, 2, 3, 4, 5, [6, 7, 8], 9, -1, 0]
    >>>s.pop(-5)
    [1, 2, 3, 4, 5, 9,-1, 0]
    >>>s.sort()
    [-1, 0, 1, 2, 3, 4, 5, 5, 9]
    >>>s.reverse()
    [9, 5, 5, 4, 3, 2, 1, 0, -1]
    >>>s.count(5)
    2
    

    利用python为list提供的这些API,我们可以很轻松实现栈和队列这两个数据结构,当然是在你不考虑插入查找操作的复杂度基础上。python的 collections [1] 这个库中的队列是更好的选择。

    >>> from collections import deque
    >>> queue = deque(["Eric", "John", "Michael"])
    >>> queue.append("Terry")           # Terry arrives
    >>> queue.append("Graham")          # Graham arrives
    >>> queue.popleft()                 # The first to arrive now leaves
    'Eric'
    >>> queue.popleft()                 # The second to arrive now leaves
    'John'
    >>> queue                           # Remaining queue in order of arrival
    deque(['Michael', 'Terry', 'Graham'])
    

    List的生成

    1.直接定义

    直接用[item1,item2, ...] 穷举法来构造处List

    2.迭代

    在Python中,迭代是通过for ... in来完成的,而很多语言比如C或者Java,迭代list是通过下标索引完成的。python的抽象程度更高,对于 dict{key:value} 可以用 for key in dict 来进行迭代另一方面,python的迭代更加的通用,它适用于所有可迭代对象。可以用下面方法判断是否为可迭代对象

    >>> from collections import Iterable
    >>> isinstance(List, Iterable) 
    True
    

    生成一个List很简单,结合之前的API和 for 关键字

    >>> squares = []
    >>> for x in range(10):
    ...     squares.append(x**2)
    ...
    >>> squares
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    

    当然对于python而言,这种写法已经算是复杂了,之后会接触很多实用的python高级函数。

    3.列表生成式

    上面的迭代写法,如果用列表生成式来写,那就是

    squares = [x**2 for x range(10)]
    

    python的语义已经非常清楚了,多写几次就能很快熟悉了。

    列表生成式很大程度的体现了python的简洁高效的特点,还可以在表达式中添加过滤条件,处理函数等等。

    >>> vec = [-4, -2, 0, 2, 4]
    
    >>> [x*2 for x in vec]
    [-8, -4, 0, 4, 8]
    
    >>> [x for x in vec if x >= 0]
    [0, 2, 4]
    
    >>> [abs(x) for x in vec]
    [4, 2, 0, 2, 4]
    

    稍微复杂一些的用法

    >>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
    >>> [weapon.strip() for weapon in freshfruit]
    ['banana', 'loganberry', 'passion fruit']
    
    >>> [(x, x**2) for x in range(6)]
    [(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]
    
    >>> vec = [[1,2,3], [4,5,6], [7,8,9]]
    >>> [num for elem in vec for num in elem]
    [1, 2, 3, 4, 5, 6, 7, 8, 9]
    

    Tuple

    元组是不可变对象,初始化之后就不可更改。所以,tuple 没有list中append() insert()这样的操作函数,tuple中的元素不可修改。在代码中,tuple带来的好处很多,要大胆的使用它。构造语句:

    >>> t=(1,2,3,4,5)
    

    tuple的概念有一点很绕,tuple对象不可变,但是tuple可以包含list这种可变的对象。

    >>> t = 12345, 54321, 'hello!'
    >>> t[0] = 1
    ...会提示修改失败
    >>> t = ([1,2,3],4,5)
    >>> t[0][2] = 4
    >>> t
    t = ([1,2,4],4,5)
    

    上面的例子,t这个tuple本身并没有变,只是其中的第一个元素内容变了。因为t[0]指向了list类型的可变对象。理解这一点,tuple就很简单了。

    Set

    set可以看成是无重复,无序key的集合,它和数学中的集合一样,两个set之间可以进行交并的操作。

    使用 set() 或者 { } 来创建,经常用于重复测试或者关系测试。

    重复插入虽然不犯错,但不实际存储。

    >>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
    >>> print(basket)                      # show that duplicates have been removed
    {'orange', 'banana', 'pear', 'apple'}
    
    >>> a = set('abracadabra')
    >>> b = set('alacazam')
    >>> a                                  # unique letters in a
    {'a', 'r', 'b', 'c', 'd'}
    >>> a - b                              # letters in a but not in b
    {'r', 'd', 'b'}
    >>> a | b                              # letters in either a or b
    {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
    >>> a & b                              # letters in both a and b
    {'a', 'c'}
    >>> a ^ b                              # letters in a or b but not both
    {'r', 'd', 'b', 'm', 'z', 'l'}
    

    Dict

    python内置了dict,也就是以 key:value 的形式存储数据,具有极快的查找速度

    • dict在内部通过 hash 直接计算处 key 对用的 value 的地址,所以查找很快
    • key 的值不可变,所以不能用List来作为 key
    • dict占用大量内存,这是肯定的,以空间换时间了
    • 同一个字典不能有重复的key,新的会覆盖旧的

    对一个字典执行 list(d.keys()) 将返回一个字典中所有关键字组成的无序列表(如果你想要排序,只需使用 sorted(d.keys()) )。使用 in 关键字可以检查字典中是否存在某个关键字(指字典)

    >>> tel = {'jack': 4098, 'sape': 4139}
    >>> tel['guido'] = 4127
    >>> tel
    {'sape': 4139, 'guido': 4127, 'jack': 4098}
    >>> tel['jack']
    4098
    >>> del tel['sape']
    >>> tel['irv'] = 4127
    >>> tel
    {'guido': 4127, 'irv': 4127, 'jack': 4098}
    >>> list(tel.keys())
    ['irv', 'guido', 'jack']
    >>> sorted(tel.keys())
    ['guido', 'irv', 'jack']
    >>> 'guido' in tel
    True
    >>> 'jack' not in tel
    False
    
    >>> d = {}  #initialize
    >>> dict(sape=4139, guido=4127, jack=4098)  #可以直接利用关键字参数传入
    {'sape': 4139, 'jack': 4098, 'guido': 4127}
    

    TIPs

    • 利用 del 语句来批量删除List 中的元素

    • 元组只有一个元素时的定义 t=(0) 会有歧义,与 t=0 作用相同,所以用 t=(0,) 来消除冲突。

    • dict和set也有与列表生成式相似的生成式

      >>> {x: x**2 for x in (2, 4, 6)}
      {2: 4, 4: 16, 6: 36}
      
      >>> {x for x in 'abracadabra' if x not in 'abc'}
      {'r', 'd'}
      


    1. collections是Python内建的一个集合模块,提供了许多有用的集合类。

    相关文章

      网友评论

        本文标题:python-基本数据结构

        本文链接:https://www.haomeiwen.com/subject/amzdattx.html