美文网首页
2020-10-13(数据结构基础)

2020-10-13(数据结构基础)

作者: 宇宙区长李小无 | 来源:发表于2020-10-13 18:28 被阅读0次

    数组

    有限个相同类型的变量组成有序集合,每个变量都是一个元素。

    内存

    由一个个连续的内存单元组成,每个内存单元都有自己的地址,这些单元中,部分是被占用的,部分是空闲的。

    而数组就是在内存单元中顺序存储,每个元素之间紧密连接。

    数组基本操作

    • 读操作(get)
      因为数组元素是有序的,所以我们通过其下标就可以直接准确地获取到想要的元素,如list[3],就是获取到其第四个元素。需要注意的是,下标不能越界。
    • 更新(update)
      直接通过数组下标就可以替换数组对应元素的值,如list[3] = 10;

    由于上述两个操作的执行时间都与数组长度无关,所以我们可以确定其时间复杂度为O(1)。

    • 插入(insert)

      • 尾插入
        当数组元素个数小于数组长度时,数组尾部是有空余空间的,所以往尾部插一个元素非常简单,直接更新index为数组元素长度的位置为新插入的元素
      • 中间插入
        这时我们还是当作数组元素个数小于数组长度,我们需要将插入位置往后的元素,从右往左遍历,依次向右移动一位,然后将插入位置更新为新插入的元素
      • 超范围插入
        首先,我们需要将数组扩容,然后再进行插入操作,扩容的话,可以创建一个大小为原来数组两倍的新数组,将原来数组依次插入,完成复制,再进行插入。
    • 删除(delete)
      由于删除元素不可能涉及到数组的扩容,完全就是数组元素位置的移动,所以比较简单,如,删除了中间元素,删除位置往后的元素从左到右依次向左移动一位即可。

    综上,插入和删除操作,均涉及到数组元素的移动,所以其时间复杂度为O(n)。

    总结

    数组是有序的集合,所以我们在访问内部元素时,非常高效便捷,只需要传入index即可,但是一旦想要操作(增、删),其他部分元素会被迫移动位置,效率受到影响。
    所以一般在读操作较多,写操作较少的场景,数组比较受欢迎。


    链表

    链表是由一个个节点组成的无序排列的数据结构

    单向链表

    是时候来张图了


    image.png(图片来自漫画算法)

    每个节点包括两部分组成

    • 数据部分(data)
    • 指针部分(next)指向下一个节点(尾节点指向null)

    这里要注意的是,看起来它的结构像这样,但是它在内存空间中,是见缝插针地进行存储的,并不像数组一样需要占用一段连续的空间。

    在进行查找时,如果我们知道了一个节点,要查找其他节点只能逐级往下进行查找。(next -> next -> next)

    如果想要从后往前查找呢?

    双向链表
    image.png(图片来自漫画算法)
    这就很明显啦。
    听懂掌声。。。

    链表操作

    • 读取操作
      链表我们都说了,只能根据next指针一级一级往下查找,所以如果我们要查找一组链表从头节点开始往后的第3个元素,那就需要先定位到头节点,然后头节点的next,next节点的next,再重复一次,才能找到目标元素

    • 更新操作
      前提是我们已经找到了该节点,那直接将其data部分给替换掉即可。

    • 插入操作

      • 尾插入
        只需要将链表的尾节点的next指针指向新插入的节点即可。
      • 中间插入
        将插入的新节点的next指针指向插入位置的节点,然后将插入位置的前一个节点的next指针指向插入的新节点。
      • 头插入
        将插入的新节点的next指针指向头节点,再将其变为头节点即可。
        链表的修改就不需要考虑扩容的问题,只要内存够,就可以一直插入
    • 删除操作
      也有三种(尾删除、中间删除、头删除),懂得自然懂...(前一个的next指向null,前一个的next指向要删除的节点的next,将原来头节点的next设定为头节点即可)

    栈和队列

    物理结构和逻辑结构

    物理结构指的是实实在在真正存在于内存中的结构,而逻辑结构一般是抽象的,底层通过物理结构实现,表现形式为其特有的结构。

    image.png(图片来自漫画算法)

    栈类似于用瓶子接水,在重力的作用下,先接进去的水肯定在底部,后进去的在顶部。这个过程就是进栈,而出栈的过程就像喝水,瓶口的水就是后接进去的。(说水会混合的杠精打死)简言之就是FILO,先进后出。
    具体用数组和链表实现的话,数据就是一环接一环,数组中需要一个数据长度的连续的内存空间,而链表中只需要零散的内存空间即可。

    再来讨论下时间复杂度,入栈操作相当于尾插入,无论是数组还是链表都是O(1)。出栈的话相当于尾切割,也是一样。

    队列

    在收银台,大家都排过队吧,一个接一个的进入队列,一个接一个的买单付款,先来的先付款,遵守秩序(插队的人,出门右转🔪)。

    如果用数组来实现队列的出队和入队:
    具体一点,一个横向数组,左侧队头,右侧队尾。出队时,左侧少一个元素,入队时,右侧多一个元素,那么如果往复循环多次,那数组长度肯定是不够的,那么我们如何在不扩容的前提下,顺利入队呢?

    循环队列

    简单来说就是重复利用数组空余的空间,队头出队后,第一个位置就空出来了,如果左侧空间大于2,那就可以满足将第一个位置设为队尾,新入队的元素依次往后排列,一图胜万言


    image.png image.png

    这样一来,就避免了数组扩容和整体移动的麻烦事。

    扩展:双端队列、优先队列(二叉堆)

    散列表

    也叫哈希表,是key-value的键值对,输入键就能马上得出其对应的值。

    中转站-哈希函数

    将每一个对象的key转换成数组对应的index。
    一般来说,每一个对象都对应一个hashCode,这是他们的唯一标识符,几乎都是一个整型变量。我们想要把key转为index,需要通过key与数组长度的模运算:
    index = hashCode(key) & Array.length;
    hashCode是一个通过key获取其对应的整型标识符的方法。

    散列表的读写操作
    • 1、写操作(put)
      在散列表插入新的键值对(entry),将key转换成index,然后将数组中index位置的元素替换为新的value,但是数组的长度有限,会出现该位置已经被占用情况。

      哈希冲突

      解决方法有两种

      • 开放寻址法:
        该位置冲突了,就重新寻找一个位置,直至找到为止。
      • 链表法:
        HashMap为例,每个数组元素对应一个链表,当哈希冲突时,直接将新元素插入到该位置的链表中即可。
    • 2、读操作(get)
      通过给定的key,找到对应的元素value。第一步先找到对应的index(by hashFunc),如果该inde对应的值的key不为给定的key,则沿着链表往下继续寻找,直至找到。

    • 3、扩容(resize)
      既然会冲突,那么一直让它冲突也不现实,这样会导致单个元素的链表长度越来越大,对后续元素的插入造成诸多影响,所以在一定条件下,我们需要进行扩容。

      判断条件就是:hashMap.size >= Capacity(hashMap当前的长度)x LoadFactory(负载因子,默认为0.75f)

      具体是怎么扩容的呢?

        1. 创建一个长度为两倍的新数组;
        1. 遍历原数组,将每个元素重新hash进新的数组中。
          经过扩容的散列表会变得稀疏,减少哈希冲突的概率,提高读写效率。

    小结:

    • 数组:相同类型,有序集合,顺序存储,随机访问;
    • 链表:链式数据结构,若干节点,前后指针,随机存储,顺序访问;
    • :先进后出,可用数组或链表实现;
    • 队列:先进先出,可用数组或链表实现;
    • 散列表:也叫哈希表,key-value,哈希函数转换index和key,哈希冲突(开放寻址和链表法解决),扩容条件:size >= capacity * loadFactory

    目前为止,介绍的数据结构均为线性的。

    相关文章

      网友评论

          本文标题:2020-10-13(数据结构基础)

          本文链接:https://www.haomeiwen.com/subject/wpjvpktx.html