一、数据结构
1.1 基本概念与术语
在谈数据结构之前,我们先来谈谈数据。正所谓"巧妇难为无米之炊",再强大的计算机,如果没有数据。也是毫无作用。
数据结构中最基本的5个概念:数据,数据元素,数据项,数据对象,数据结构;
1.1.1 数据
是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
1.1.2 数据元素
是组成数据的,且有一定意义的基本单位,在计算机中通常作为整体处理。
1.1.3 数据项
一个数据元素可以由若干数据项组成。数据项是数据不可分割的最小单位。
1.1.4 数据对象
是性质相同的数据元素的集合,是数据的子集。
1.1.5 数据结构
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
1.2 逻辑结构与物理结构
根据视角不同,我们将数据结构分为2种:逻辑结构与物理结构。
1.2.1 逻辑结构
逻辑结构:指的是数据对象中的数据元素之间的相互关系。
逻辑结构分为四种:集合结构,线性结构,树形结构,图形结构。
集合结构
集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。各个数据元素是"平等"的。它们的共同属性是:"同属于一个集合"。
线性结构
线性结构:线性结构中的数据元素之间是一对一的关系.常用的线性结构有:线性表,栈,队列,双队列,数组,串。
树型结构
树型结构:重要的非线性数据结构。树形数据结构可以表示数据表素之间一对多的关系.树型结构中的数据元素之间存在一种一对多的层次关系.常见的树形结构:二叉树,B树,哈夫曼树,红黑树等。
图形结构
图形结构:图形结构的数据元素是多对多的关系.常见的图形结构:邻近矩阵,邻接表
1.2.2 物理结构
物理结构,别称"存储结构"。顾名思义,指的是数据的逻辑结构在计算机的存储形式。
设计好逻辑数据结构之后,数据的存储也是非常重要的.数据存储结构应该正确反映数据元素之间的逻辑关系.这才是关键! 如何存储数据元素之间的逻辑关系,是实现物理结构的重点和难点。
数据元素的存储结构形式有2种:顺序存储和链式存储;
顺序存储结构
顺序存储结构:是指把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
链式存储结构
链式存储结构:是把数据元素放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。数据元素的存储关系并不能反映逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关关联数据元素的位置。
显然,链式存储就灵活多了。数据存储在哪里不重要的,只要有一个指针存放了相应的地址就能找到它了。
总结逻辑结构是面向问题的,而物理结构就是面向计算机的。其基本的目标就是将数据以及逻辑关系存储到计算机的内存中。
1.3 抽象数据类型
1.3.1 数据类型
数据类型:是指一组性质相同值的集合以及定义在此集合的一些操作的总称。
在C语言中,按照取值不同,数据类型可以分为2类:
原子类型:是不可以在分解的基本数据类型,包含整型,浮点型,字符型等;
结构类型:由若干类型组合而成,是可以再分解的.例如,整型数组就是由若干整型数据组成的。
1.3.2 抽象数据类型
抽象,是抽取出事物具有的普遍性的本质。它是抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏繁杂的细节,只保留实现目标所必需的信息。
抽象数据类型:是指一个数学模型以及定义在该模型上的一组操作; 例如,我们在编写计算机绘图软件系统时,经常会使用到坐标。也就是说,会经常使用x,y来描述横纵坐标。而在3D系统中,Z深度就会出现。既然这3个整型数字是始终出现在一起。那就可以定义成一个Point的抽象数据类型。它有x,y,z三个整型变量。这样开发者就非常方便操作Point 数据变量。
抽象数据类型可以理解成实际开发里经常使用的结构体和类; 根据业务需求定义合适的数据类型以及动作。
二.算法
算法:是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
2.1 算法与数据结构的关系
什么是算法:解决特定问题的求解步骤的描述; 而数据结构如果脱离算法,或者算法脱离数据结构都是无法进行的。所以在大学课程里,即便单独算法课程里也涵盖了数据结构的内容。
程序设计 = 数据结构 + 算法
2.2 算法定义
算法:描述解决问题的方法。
2.3 算法的特性
算法必须具备几个基本特性:输入,输出,有穷性,确定性和可行性;
输入输出
输入输出,很好理解。在解决问题时必须有已知条件,当然有些算法可能没有输入。但是算法至少有一个或多个输出.否则没有输出,没有结果.你用这个算法干吗?
有穷性
有穷性:指的是算法在执行有限的步骤之后,自动结束而不会出现无限循环,且每一个步骤在可接受的时间内完成。
确定性
确定性:算法的每一个步骤都具有确定的含义,不能出现二义性; 算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果。
可行性
可行性:算法的每一步都必须是可行的,换句话说,每一步都能通过执行有限次数完成。
2.4 算法设计要求
正确性
算法的正确性是指算法至少应该具有输入,输出和加工处理无歧义性,能正确反映问题的需求,能够得到问题的正确答案;
正确分为4个层次:(1).算法程序没有语法错误; (2).算法程序对于合法的输入数据能够产生满足要求的输出结果; (3).算法程序对于非法的输入数据能够得出满足规格说明的结果;(4).算法程序对于精心选择的,甚至刁钻的测试数据都有满足要求的输出结果;
可读性
可读性:算法设计的另一个目的是为了便于阅读,理解和交流;
健壮性
健壮性:当输入数据不合法时,算法也能做出相关处理,而不是产生异常和莫名其妙的结果;
时间效率高和存储量低
生活中,人们希望花最少的钱,用最短的时间,办最大的事。算法也是一样的思想。用最少的存储空间,花最少的时间,办成同样的事.就是好算法!
2.5 算法效率的度量方法
使用高级程序语言编写的程序在计算机上运行时所消耗的时间取决于下列的因素:
算法采用的策略,方法;
编译产生的代码质量;
问题的输入规模;
机器执行指令的速度。
一个算法在执行过程中所消耗的时间取决于以下的因素:
算法所需数据输入时间
算法编译为可执行程序的时间
计算机执行每条指令所需的时间
算法语句中重复执行的次数
1)依赖于输入设备的性能,若是脱机输入,则输入数据的时间可以忽略不计。(2)(3)取决于计算机本身执行的速度和编译程序的性能
习惯上将算法语句重复执行的次数作为算法的时间量度
2.6 算法的时间复杂度

2.7 最坏情况与最好情况
最坏的情况运行时间是一种保证, 那就是运行时间将不会比这更坏了。在应用中,这是一种最重要的需求,通常除非特别指定,我们提到的运行时间都是最坏情况下的运行时间。
平均运行时间是所有情况中最有意义的,因为它是期望的运行时间.一般没有特殊情况下,都是指最坏时间复杂度。
2.8 算法空间复杂度
算法设计有一个重要原则,即空间/时间权衡原则(space/time tradeoff)。
算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记做:S(n) = n(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。
除了需要寄存本身所用的指令,常数,变量和输入数据外,还需要一些对数据进行操作的辅助存储空间。
注意,算法的空间复杂度指的并不是整个算法在内存占用空间,而是指的是该算法在实现时所需要的辅助空间就可以。
对一个算法,其时间复杂度和空间复杂度往往会互相影响。当追求一个较好的时间空间复杂度时,可能会导致占用较多的存储空间。即可能会使用空间复杂度的性能变差.反之亦然。不过,通常情况下,鉴于运算空间较为充足,人们都以算法时间空间复杂度作为算法优先的衡量指标。
网友评论