数据结构起源
早期人们都把计算机理解为数值计算工具,就是感觉计算机当然是用来计算的,所以计算机解决问题,应该是先从具体问题中抽象出一个适当的数据模型,设计出一个解此数据模型的算法,然后再编写程序,得到一个实际的软件。
可现实中,我们更多的不是解决数值计算的问题,而是需要一些更科学有效的手段(比如表、树和图等数据结构)的帮助,才能更好地处理问题。所以「数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科」。
基本概念和术语
- 数据 「数据是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合」。数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
- 数据元素 「数据元素是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。」
- 数据项 「数据项:一个数据元素可以由若干个数据项组成。」 「数据项是数据不可分割的最小单位。」
- 数据对象 「数据对象是性质相同的数据元素的集合,是数据的子集。」
- 数据结构 结构,简单的理解就是关系,比如分子结构,就是说组成分子的原子之间的排列方式。严格点说,结构是指各个组成部分相互搭配和排列的方式。在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。那数据结构是什么? 「数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。」
逻辑结构与物理结构
逻辑结构
「逻辑结构」是指数据对象中数据元素之间的相互关系,主要分为一下四种:
1. 集合结构
「集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系」。各个数据元素是“平等”的,它们的共同属性是“同属于一个集合”。数据结构中的集合关系就类似于数学中的集合。
2. 线性结构
「线性结构中的数据元素之间是一对一的关系」。
3. 树形结构
「树形结构的数据元素是一对多的层关系。」
4. 图形结构
「图形结构的数据元素是多对多的关系。」
我们在用示意图表示数据的逻辑结构时,要注意两点:
- 将每一个数据元素看做一个结点,用圆圈表示。
- 元素之间的逻辑关系用结点之间的连线表示,如果这个关系是有方向的,那么用带箭头的连线表示。
物理结构
「物理结构」是指数据的逻辑结构在计算机中的存储形式。存储形式有两种:
- 顺序存储结构 「顺序存储结构是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。」
2. 链式存储结构
「链式存储结构是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的也可以是不连续的。」
抽象数据类型
数据类型
「数据类型是指一组性质相同的值的集合及都定义在此集合上的一些操作的总称。」
数据类型是按照值的不同进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
数据类型可以分为两类:
- 原子类型:是「不可以再分解的基本类型」,包括整形,字符型等。
- 结构类型:有「若干个类型组合而成,是可以再分解」的。例如,整形数组由多个整形数据组成的。
抽象数据类型
「抽象数据类型是指一个数学模型及定义在该模型上的一组操作。」
抽象数据的类型的定义仅取决与它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。
比如各种计算机,不管是大型机、小型机、PC、平板电脑、PDA,甚至智能手机都拥有“整数”类型,也需要整数间的运算,那么整型其实就是一个抽象数据类型,尽管它在上面提到的这些在不同计算机中实现方法上可能不一样,但由 于其定义的数学特性相同,在计算机编程者看来,它们都是相同的。因此,「“抽象”的意义在于数据类型的数学抽象特性。」
一个抽象数据类型定义了「一个数据对象,数据对象中各数据元素之间的关系及对数据元素的操作」。它体现了程序设计中「问题分解」,「抽象」和「信息隐藏」的特性。
❝参考资料 [1] 大话数据结构 / 程杰 著. --北京:清华大学出版社,2011.6 ❞