美文网首页
「Python基础」数据结构比较

「Python基础」数据结构比较

作者: 言淦 | 来源:发表于2018-10-21 21:40 被阅读0次

    测试环境:Centos7+Python3.5

    Python3中,常见的数据结构有四种,list, dict, set, tuple,以下是他们的一些比较

    一、简介
    list:列表,与C语言的list稍有不同。第一,Python的list可存储不同类型的数据;第二,Python的list分配空间时会多分一部分空间,避免重复创建list带来的开销。

    列表的内部结构

    上图就是list的内部实现,由于索引和数据是分离的,所以数据的类型可以是整型,或者是字符串,甚至是另一个list。
    tuple:有序列表,但初始化后数据便不可修改(没有提供增删查改的方法)
    dict:哈希表,数据存储的格式是一种键值对(key-value)的形式。根据key的值能直接找到对应的内存地址,进而找到数据,所以查找速度比list快
    set:set的实现跟dict类似,只不过少了key,且数据不可重复

    二、适用场景(优缺点,存在的意义)
    list VS tuple:
    1.list和tuple都是有序列表
    2.list内的数据是可增删查改的,而tuple内的数据一旦初始化后便不可修改

    list VS dict:

    1. list是有序的,dict是无序的;
    2. 两者都是可增删查改的;
    3. list的插入查找速度没有比dict快,且随着数据的增大差距更明显;
    4. 虽然list的速度较慢,但是占用内存较小(不用存储key)

    set:set的数据也是无序的,适合于数据不重复的场景

    三、增删查改及对应的时间复杂度(占用的空间)
    http://www.orangecube.net/python-time-complexity

    四、数据的迭代
    四者都可通过for循环迭代,只不过dict迭代的是key

    五、数据的排序

    # list 有两种方式排序
    >>> a = [3, 2, 1]  # 默认是升序,从低到高,可通过reverse参数指定升降序
    >>> a.sort()
    >>> a
    [1, 2, 3]
    
    >>> a
    [3, 2, 1]
    >>> sorted(a)
    [1, 2, 3]
    
    # dict
    ## 如果传入的是整个字典,则默认对key进行排序,key这个参数就没有作用
    >>> d = {'aa': 1, 'bb': 2, 'cc': 5, 'ss': 3}
    >>> d_sort = sorted(d, key=lambda x: x[1])
    >>> d_sort
    ['aa', 'bb', 'cc', 'ss']
    
    ## 如果传入的是字典元素,则key参数起作用,可通过key排序,也可通过value排序,返回一个list
    >>> d_sort = sorted(d.items(), key=lambda x: x[1], reverse=False)
    >>> d_sort
    [('aa', 1), ('bb', 2), ('ss', 3), ('cc', 5)]
    
    # set的排序返回的是一个list
    a = {1, 2, 3}
    >>> sorted(a)
    [1, 2, 3]
    >>> type(sorted(a))
    <class 'list'>
    
    # tuple 数据不可变,所以不可以排序
    

    六、数据的差集,交集和并集

    list(set(a).union(set(b))) # 并集
    list(set(b).difference(set(a))) # 差集, b中有而a中没有的
    list(set(a).intersection(set(b))) # 交集

    七、数据的排列组合
    转载自此文章:https://blog.csdn.net/lanchunhui/article/details/49494265

    组合

    from itertools import combinations
    combins = [c for c in combinations(range(5), 2)]
    combins # 而且是按序排列
    [(0, 1), (0, 2), (0, 3), (0, 4), (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]

    排列

    from itertools import permutations
    perms = permutations(range(5), 2)
    perms
    [(0, 1), (0, 2), (0, 3), (0, 4), (1, 0), (1, 2), (1, 3), (1, 4), (2, 0), (2, 1),
    (2, 3), (2, 4), (3, 0), (3, 1), (3, 2), (3, 4), (4, 0), (4, 1), (4, 2), (4, 3)]

    八、其它
    1.dict 替换 key (dict[new_key] = dict.pop(key))
    http://blog.csdn.net/jt674106399/article/details/76516186

    2.dict 判断键是否存在(py2 用 dict.has_keys(), py3 用 key in dict)
    https://blog.csdn.net/maverick1990/article/details/19908507

    3.biset: 二分排序模块,比list高效
    http://python.jobbole.com/86609/
    https://www.cnblogs.com/skydesign/archive/2011/09/02/2163592.html

    4.memoryview 和 bytearray: 适用与字节情况,如socket
    https://segmentfault.com/q/1010000007137721

    1. List的append方法和 + 区别
      list = list + [i] # 将list 和 [i] 的值合并成一个新的list, 开销大
      list += [i] # 在list上直接操作,时间快一点

    相关文章

      网友评论

          本文标题:「Python基础」数据结构比较

          本文链接:https://www.haomeiwen.com/subject/bfwbzftx.html