美文网首页Python3 学习笔记
Python_6_内置结构-字典

Python_6_内置结构-字典

作者: 静堂先生 | 来源:发表于2019-05-28 16:35 被阅读0次

    1. 字典介绍

      在 Python 中字典属于一种映射类型,它和 set 相同,同样属于非线性结构,Python 官方对 dict 有如下解释:

    • 一个映射对象映射一个可 hash 的值到任意一个对象上去。
    • 映射是可变的对象。
    • dict 是当前唯一一个标准的映射类型。
    • 字典的键几乎可以是任意的值。
    • 字典的值不必可 hash,也就是说值可以是列表,字典,或者其他任意可变的对象
    • 如果 key 相同,那么后面的 value 将会覆盖先前的 value
    • 不建议使用 float 类型作为字典的 key

      简单来说:字典是由 key:value 键值对组成的数据的集合,它的主要特点是 可变的无序的不重复的

    字典的 key 必须是可 hash 对象,之所以快,因为其本质上是 用空间换时间

    2. 字典的基本操作

      字典是除集合 (set) 以外另一种可变的非线性容器模型,在 Python 中非常强大,适合各种结构数据的存储、嵌套等。

    2.1. 字典的定义

      字典的每个 key 与 value 的键值对用冒号 : 分割,每对之间用逗号 , 分割,整个字典包括在花括号 { } 中。例:{'a':1, 'b':2},Python 提供了多种创建字典的方式,如下:

    • 基本格式:d = dict() 或者 d = {}
    • dict(**kwargs):使用 name=value 对,来初始化一个字典
    • dict(iterable, **kwargs):使用可迭代对象和 name=value 构造字典,注意 可迭代对象必须是一个二元结构
    • dict(mapping, **kwargs): 使用一个字典构造另一个字典
    • dic = {'a':1, 'b':2, 'c':3, 'd':[1,2,3]}
    • dic = dict.fromkeys(iterable, value): 使用可迭代对象的值作为 key 生成字典,value 默认为 0,否则用指定的 value 对字典进行初始化。
    In : d1=dict()
    
    In : d2={}
    
    In : d3 = dict(a=1, b=2) ; d3 
    Out: {'a': 1, 'b': 2}
    
    In : d4 = dict([('a', 1),('b', 2)], c=3, d=4) ; d4
    Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4}
    
    In : d5 = dict(d4, e=5, f=6) ; d5
    Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
    
    In : d7 = dict.fromkeys(range(5)) ; d7
    Out: {0: None, 1: None, 2: None, 3: None, 4: None}
    
    In : d8 = dict.fromkeys(range(5), 100) ; d8 
    Out: {0: 100, 1: 100, 2: 100, 3: 100, 4: 100} 
    

    2.2. 字典元素的访问

      有如下三种方式访问字典的键值对:

    1. d[key]:返回 key 对应的 value,key 不存在抛出 KeyError 异常
    2. dict.get(key[, default]):返回 key 对应的 value,key 不存在返回缺省值,如果没有设置缺省值返回 None
    3. dict.setdefault(key[, default]):返回 key 对应的值 value,key 不存在,添加 key:value 键值对(value 设置为 default),并返回 value,如果 default 没有设置缺省为 None
    In : dic = {'a':1, 'b':2, 'c':3, 'd':4}
    
    In : dic['a']
    Out: 1
    
    In : dic['e']   # 不存在 'e' 这个 key,所以直接访问会出现异常
    ---------------------------------------------------------------------------
    KeyError                                  Traceback(most recent call last)
    <ipython-input-34-87d22c709971> in <module>
    ----> 1 dic['e']
    
    KeyError: 'e'
    
    In : dic.get('a')     # key 存在,则返回对应的值
    Out: 1
    
    In : dic.get('e')     # 不存在,默认会返回 None,ipython 优化了 None 的输出,所以这里无显示
    
    In : dic.get('e', 'not exist')     # 不存在时,由指定的 default 进行返回
    Out: 'not exist'
    
    In : dic.setdefault('a', 'ok')   # 设置 a 的值为 ok,a 存在,所以返回 a 对应的值 1
    Out: 1
    
    In : dic.setdefault('e', 'ok')   # 设置 e 的值为 ok,e 不存在,所以设置并返回 value(key 不存在时等同于设置并访问了)
    Out: 'ok'
    
    In : dic
    Out: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
    

    当然字典也可以被迭代访问,后面介绍

    2.3. 字典的增删改

      由于字典可变、非线性、无序的特性,而且字典的 key 必须是可 hash 的对象,查找某个 key 也是直接 hash(),然后找到对应的位置的,所以我们对它某个 key 的修改可以理解为是时间复杂度 O(1) 的操作,效率很高,主要有以下几种方法。

    • d[key] = value: 将 key 对应的值修改为 value,key 不存在添加新的 key:value 对。
    • dic.update([other]) --> None: 使用另一个字典的 k,v 对更新本字典,key 不存在时添加,存在时则覆盖,所以不会返回新的字典,属于原地修改。
    • dic.pop(key[, default]): key 存在,移除它,并返回它的 value,key 不存在返回指定的 default,如果 default 未指定,那么会返回 KeyError 异常。
    • dic.popitem(): 移除并返回一个任意的键值对,字典为 empty 时,抛出 KeyError 异常。
    • dic.clear(): 清空字典。
    • del dic['a']: 通用的删除变量方法。
    In : dic = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
    
    In : dic['a'] = 1000 ; dic
    Out: {'a': 1000, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok'}
    
    In : dic2 = {'a':200,'f':50} ; dic.update(dic2) ; dic
    Out: {'a': 200, 'b': 2, 'c': 3, 'd': 4, 'e': 'ok', 'f': 50}
    
    In : dic.pop('a')             # 弹出一个 key'a',key 存在返回 key 对应的 value
    Out: 200
    
    In : dic
    Out: {'b': 2, 'c': 3, 'd': 4, 'e': 'ok', 'f': 50}
    
    In : dic.pop('g')              # 弹出一个 key'g',key 不存在,又没有指定 default,则会报 KeyError 异常
    ---------------------------------------------------------------------------
    KeyError                                  Traceback(most recent call last)
    <ipython-input-49-311c3ba80251> in <module>
    ----> 1 dic.pop('g')
    
    KeyError: 'g'
    
    In : dic.pop('g','not exist')       # 指定了 default,当 key 不存在时,会返回指定的 default 值 
    Out: 'not exist'
    
    In : dic.popitem()          # 弹出一个 key:valyue 键值对,返回对象是元组形式
    Out:('d', 4)
    
    In : dic
    Out: {'b': 2, 'c': 3, 'e': 'ok', 'f': 50}
    
    In : del dic['e'] ; dic
    Out: {'b': 2, 'c': 3, 'f': 50}
    
    In : dic.clear()
    
    In : dic
    Out: {}
    

      当我们以字典的某个对象比如 keys,values,items 等为条件对字典进行遍历时,我们不能在遍历的同时删除字典的元素,字典在运行时不允许长度改变,但是在 list 中这种操作是可以的,但是会得到意想不到的结果,建议对容器进行遍历的同时不要修改它的长度。

    In : s = {'a': 1, 'b': 2, 'c': 4, 'd': 5, 'e': 7, 'j': 10}
    
    In : len(s)  
    Out: 6
    
    In : for i in range(6): 
    ...:     s.popitem() 
    ...:
    
    In : s  
    Out: {}
    
    # 下面这种方式是错的,也是绝对不可以的。
    In : for i in s.keys():
    ...:     s.pop(i)
    ...:
    ---------------------------------------------------------------------------
    RuntimeError                              Traceback (most recent call last)
    <ipython-input-35-9c51f70f750a> in <module>
    ----> 1 for i in s.keys():
          2     s.pop(i)
          3
    
    RuntimeError: dictionary changed size during iteration
    

    3. 字典遍历

      在 Python 中,我们所说的基本数据结构:字符串、元组、列表,集合,包括字典,都可以认为是一个容器箱子,只要是容器,我们就可以进行遍历(是否有序和是否可以遍历没有必然关系,只不过有序的话是顺序拿出,而无序则是随机拿出),我们可以使用多种方式对字典进行迭代遍历,但是有些地方和其他类型不同。

    3.1. 遍历字典的 key

      dic.keys(): --> dict_keys --> 返回字典 dic 的所有 key 组成的一个 dict_keys 视图集合(类 set 结构,不会生成新的内存空间)。

    In : dic = {'a':1, 'b':2, 'c':3, 'd':4}
    
    In : for key in dic: 
    ...:     print(key)
    ...:
    a
    d
    c
    b
    
    In : for key in dic.keys(): 
    ...:     print(key)
    ...:
    a
    d
    c
    b
    
    In : dic.keys()
    Out: dict_keys(['a', 'd', 'c', 'b'])
    

      迭代字典就是在迭代字典的 key,所以直接迭代字典和使用字典的 keys() 方法返回一个 keys 的视图然后再迭代,是一样的效果。

    3.2. 遍历字典的 value

      dic.values(): --> dict_values --> 返回字典 dic 的所有 values 组成的一个 dict_values 视图集合(类 set 结构,不会生成新的内存空间)。

    In : for i in dic: 
    ...:     print(dic[i])
    ...:
    1
    2
    3
    4
    
    In : for i in dic.values(): 
    ...:     print(i)
    ...:
    1
    2
    3
    4
    
    In : dic.values()  
    Out: dict_values([1, 2, 3, 4])
    

      可以首先遍历字典的 key,然后再通过 key 来访问对应的 value,也可以通过 dic.values() 直接访问 values。

    3.3. 变量字典的键值对

      dic.items(): --> dict_items :返回字典 dic 的所有的 key 和 value(每个 key 和 value 的键值对由元组表示) 组成的一个 dict_items 视图集合(类 set 结构,不会生成新的内存空间)。

    In : for i in dic.items(): 
    ...:     print(i) 
    ...:
    ('a', 1)
    ('b', 2)
    ('c', 3)
    ('d', 4)
    
    In : for key,value in dic.items(): 
    ...:     print('key:{} value:{}'.format(key,value)) 
    ...:
    key:a value:1
    key:b value:2
    key:c value:3
    key:d value:4
    

      由于返回的每个键值对为元组格式,那么利用我们前面学的封装与解构,可以很方便的获取 key 和它对应的 value

    3.4. 字典遍历小结

      在 Python3 中,keys、values、items 方法返回一个类似生成器的可迭代对象,不会把函数的返回结果复制到内存空间中。

    • Dictionary view 对象,可以使用 len()、iter()、in 操作
    • 字典的 entry 的动态视图,字典变化,视图将反映出这些变化
    • keys 返回一个类似 set 的对象,也可以看作是一个 set 集合,如果 values 可 hash 的话,那么 items 也可以看作是类 set 对象

      Python 2 中,keys、values、items 方法会返回一个新的列表,占据新的内存空间,所以 Python 2 建议使用 iterkeys、itervalues、iteritems,返回一个迭代器,而不是返回一个 copy

    [11:20:32 python@centos7 ~]$ python
    Python 2.7.5(default, Oct 30 2018, 23:45:53) 
    [GCC 4.8.5 20150623(Red Hat 4.8.5-36)] on linux2
    Type "help", "copyright", "credits" or "license" for more information.
    >>> s = {'a':1,'b':2}
    >>> s.keys()    # 直接生成一个 keys 的列表
    ['a', 'b']
    >>> s.iterkeys()   # 对象,迭代可以获取数据
    <dictionary-keyiterator object at 0x7f271c5fa520>
    

    4. defaultdict 默认值字典

      defaultdit object 是 dict 的子类,我们称它为默认值字典,即在创建字典时给所有的 value 指定一个默认值,它存放在 collections 模块中,使用前需要先进行导入。为什么有默认值字典这种类型呢?请看如下代码:

    dic = {}
    for i in 'abacdabeddfef':
        if i not in dic:     # 这句其实也可以优化为 dic[i] = dic.get(i, 0) + 1
            dic[i] = 0
        dic[i] += 1
    print(dic)
    
    # 结果:
    {'a': 3, 'b': 2, 'c': 1, 'd': 3, 'e': 2, 'f': 2}
    

      我们在计算一个字符串或者一个列表中的元素重复的次数时,通常会用到字典对齐进行计数,如果元素不存在字典中,那么就需要初始化元素,当我们使用默认值字典时,就可以优化的更简洁。
      当 key 不存在时,返回的是工厂函数的默认值,比如 list 对应 [ ],str 对应的是空字符串,set 对应 set( ),int 对应 0

    from collections import defaultdict
    dic = defaultdict(int)   # defaultdict(lambda :0)  这种方法也可以设置默认为 0
    for i in 'abacdabeddfef':
        dic[i] += 1    # 默认是 int 型,可以直接加减
    print(dic)
    
    # 结果:
    defaultdict(<class 'int'>, {'a': 3, 'b': 2, 'c': 1, 'd': 3, 'e': 2, 'f': 2})
    

    5. OrderedDict 有序字典

      Ordered dictionaries 像一个有序字典,但是它记住的是插入元素的顺序。当我们迭代有序字典时,它会按照这些键值对插入的顺序返回。它同样存在于 collections 模块中,需要使用时请先导入。

    In : from collections import OrderedDict
    
    In : dic = OrderedDict()  
    
    In : dic = dic.fromkeys('abc', 1) ; dic
    Out: OrderedDict([('a', 1),('b', 1),('c', 1)])
    
    In : for k,v in dic.items():     # 按照插入的顺序
    ...:     print(k, v) 
    ...:
    a 1
    b 1
    c 1
    
    In : dic = dict([('a', 1),('b', 1),('c', 1)])  
    
    In : for k,v in dic.items():    # 无序的
    ...:     print(k, v) 
    ...:
    a 1
    c 1
    b 1
    

      注意:在 3.6 的版本的 python/ipython 解释器中,直接迭代或者打印时,是有序的(OrderedDict),但是在 3.5 版本以前都是随机的,千万不要以为字典是有序的!

    相关文章

      网友评论

        本文标题:Python_6_内置结构-字典

        本文链接:https://www.haomeiwen.com/subject/txwdtctx.html