顺序表

作者: 小董不太懂 | 来源:发表于2019-08-15 20:28 被阅读0次

    基本数据类型的存储:

    我们先尝试讨论一下,基本数据类型在内存中是如何存储的,因为列表、集合之类的是python已经给我们封装好的高级数据,我们就先来讨论整型是如何存储的。内存是以一个字节作为存储单位的。

    如上图所示,我们存储一个整型的a,整型需要四个字节,类型不同,在内存中所占的存储单元就不同,当我们从内存中出数据的时候,也会按照
    类型的不同进行区别对待。

    拓展:

    那如果我们存的是列表的形式呢? 上图中,一个框就代表了我们前面提到的存储整型的四个字节,故前面的地址也在变化,地址间隔为4,三个地址块连接在一起,这样一来,如果我们想取列表中的第三个元素,我们就可以直接通过地址偏移获得。
    当我们存储同类型的数据,这样是不是很容易获取,这样就引入了顺序表的基本概念。

    顺序表

    在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。
    对于这种需求,最简单的解决方案便是将这样一组元素看成一个序列,用元素在序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示数据之间的某种关系。
    这样的一组序列元素的组织形式,我们可以将其抽象为线性表。一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一,在实际程序中应用非常广泛,它还经常被用作更复杂的数据结构的实现基础。

    根据线性表的实际存储方式,分为两种实现模型:

    • 顺序表,将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示。
    • 链表,将元素存放在通过链接构造起来的一系列存储块中。

    如上图表示的是顺序表的基本形式,数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址Loc (e0)加上逻辑地址(第i个元素)与存储单元大小(c)的乘积计算而得,即:Loc(ei) = Loc(e0) + c*i
    故,访问指定元素时无需从头遍历,通过计算便可获得对应地址,其时间复杂度为O(1)。

    我们不妨在看一下这个例子,是不是所谓的地址下标就是偏移量了啊。第0号元素没有偏移,第三个元素偏移了3*4Byte,这个是不是就很容易理解了啊。
    以上我们只介绍了同类型的元素,如果是不同类型的元素组合,我们要如何处理呢? 如图所示,我们这个li列表就是不同元素的组合,因为不同类型的元素所占的的内存大小不同,就无法再采用我们第一种的连续存储方法了。这种不同类型的元素会存储在不同的地方,他们的存储地址也是随机不确定的,那我们如何存储这个列表呢?
    我们会为这些地址额外申请一个内存,专门用来存储这几个地址,地址占四个字节,所以我们要申请16的存储单元,li列表直接指向存储内存地址的那部分内存,其他同我们第一种顺序表的方法类似。
    我们总结一下第二种方法:
    如果元素的大小不统一,则须采用图b的元素外置的形式,将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)。由于每个链接所需的存储量相同,通过上述公式,可以计算出元素链接的存储位置,而后顺着链接找到实际存储的数据元素。注意,图b中的c不再是数据元素的大小,而是存储一个链接地址所需的存储量,这个量通常很小。上图这样的顺序表也被称为对实际数据的索引,这是最简单的索引结构。

    知道了基本的顺序表结构之后,不去考虑语言,如何去实现顺序表?让我们再次了解顺序表。

    顺序表的结构与实现

    顺序表的结构

    一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数两项。

    顺序表的两种基本实现方式

    第一种方式:第一个地址不在是第一个元素,而是跳过数据区的两个元素之后的元素才是我们想要的那第一个元素
    第二种方式:分开存储,一部分是存储数据区和第一个元素的地址

    我们比较一下###基本数据类型的存储:

    我们先尝试讨论一下,基本数据类型在内存中是如何存储的,因为列表、集合之类的是python已经给我们封装好的高级数据,我们就先来讨论整型是如何存储的。内存是以一个字节作为存储单位的。

    如上图所示,我们存储一个整型的a,整型需要四个字节,类型不同,在内存中所占的存储单元就不同,当我们从内存中出数据的时候,也会按照
    类型的不同进行区别对待。

    拓展:

    那如果我们存的是列表的形式呢? 上图中,一个框就代表了我们前面提到的存储整型的四个字节,故前面的地址也在变化,地址间隔为4,三个地址块连接在一起,这样一来,如果我们想取列表中的第三个元素,我们就可以直接通过地址偏移获得。
    当我们存储同类型的数据,这样是不是很容易获取,这样就引入了顺序表的基本概念。

    顺序表

    在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。
    对于这种需求,最简单的解决方案便是将这样一组元素看成一个序列,用元素在序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示数据之间的某种关系。
    这样的一组序列元素的组织形式,我们可以将其抽象为线性表。一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一,在实际程序中应用非常广泛,它还经常被用作更复杂的数据结构的实现基础。

    根据线性表的实际存储方式,分为两种实现模型:

    • 顺序表,将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示。
    • 链表,将元素存放在通过链接构造起来的一系列存储块中。

    如上图表示的是顺序表的基本形式,数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址Loc (e0)加上逻辑地址(第i个元素)与存储单元大小(c)的乘积计算而得,即:Loc(ei) = Loc(e0) + c*i
    故,访问指定元素时无需从头遍历,通过计算便可获得对应地址,其时间复杂度为O(1)。

    我们不妨在看一下这个例子,是不是所谓的地址下标就是偏移量了啊。第0号元素没有偏移,第三个元素偏移了3*4Byte,这个是不是就很容易理解了啊。
    以上我们只介绍了同类型的元素,如果是不同类型的元素组合,我们要如何处理呢? 如图所示,我们这个li列表就是不同元素的组合,因为不同类型的元素所占的的内存大小不同,就无法再采用我们第一种的连续存储方法了。这种不同类型的元素会存储在不同的地方,他们的存储地址也是随机不确定的,那我们如何存储这个列表呢?
    我们会为这些地址额外申请一个内存,专门用来存储这几个地址,地址占四个字节,所以我们要申请16的存储单元,li列表直接指向存储内存地址的那部分内存,其他同我们第一种顺序表的方法类似。
    我们总结一下第二种方法:
    如果元素的大小不统一,则须采用图b的元素外置的形式,将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)。由于每个链接所需的存储量相同,通过上述公式,可以计算出元素链接的存储位置,而后顺着链接找到实际存储的数据元素。注意,图b中的c不再是数据元素的大小,而是存储一个链接地址所需的存储量,这个量通常很小。上图这样的顺序表也被称为对实际数据的索引,这是最简单的索引结构。

    知道了基本的顺序表结构之后,不去考虑语言,如何去实现顺序表?让我们再次了解顺序表。

    顺序表的结构与实现

    顺序表的结构

    一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数两项。

    顺序表的两种基本实现方式

    第一种方式:第一个地址不在是第一个元素,而是跳过数据区的两个元素之后的元素才是我们想要的那第一个元素
    第二种方式:分开存储,一部分是存储数据区和第一个元素的地址

    • 图a为一体式结构,存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的顺序表对象。一体式结构整体性强,易于管理。但是由于数据元素存储区域是表对象的一部分,顺序表创建后,元素存储区就固定了。
    • 图b为分离式结构,表对象里只保存与整个表有关的信息(即容量和元素个数),实际数据元素存放在另一个独立的元素存储区里,通过链接与基本表对象关联。

    我们比较一下分离式和一体式的优劣

    乍一看,好像区别不大,如果我们要继续添加元素呢? 如果我们采用一体式会发现存储单元不够用,那不够用咋办?只能去重新申请一整块存储空间去存储数据区,同时还要考虑表头数据。而分离式则不需要考虑表头,直接申请一块存储空间存储数据区,然后将表头信息中的地址指向我们新申请的即可。

    元素存储区替换

    一体式结构由于顺序表信息区与数据区连续存储在一起,所以若想更换数据区,则只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变了。
    分离式结构若想更换数据区,只需将表信息区中的数据区链接地址更新即可,而该顺序表对象不变。

    元素存储区扩充

    采用分离式结构的顺序表,若将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改。只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法进行。人们把采用这种技术实现的顺序表称为动态顺序表,因为其容量可以在使用中动态变化。

    扩充的两种策略

    • 每次扩充增加固定数目的存储位置,如每次扩充增加10个元素位置,这种策略可称为线性增长。
      特点:节省空间,但是扩充操作频繁,操作次数多。
    • 每次扩充容量加倍,如每次扩充增加一倍存储空间。
      特点:减少了扩充操作的执行次数,但可能会浪费空间资源。以空间换时间,推荐的方式。

    相关文章

      网友评论

          本文标题:顺序表

          本文链接:https://www.haomeiwen.com/subject/kvevjctx.html