公共基础知识总结

第一章数据结构与算法

1.1 算法

算法：是指解题方案的准确而完整的描述。

算法不等于程序，也不等计算机方法，程序的编制不可能优于算法的设计。

算法的基本特征：是一组严谨地定义运算顺序的规则，每一个规则都是有效的，是明确的，此顺序将在有限的次数下终止。特征包括：

（1）可行性；

（2）确定性，算法中每一步骤都必须有明确定义，不充许有模棱两可的解释，不允许有多义性；

（3）有穷性，算法必须能在有限的时间内做完，即能在执行有限个步骤后终止，包括合理的执行时间的含义；

（4）拥有足够的情报。

算法的基本要素：一是对数据对象的运算和操作；二是算法的控制结构。

指令系统：一个计算机系统能执行的所有指令的集合。

基本运算和操作包括：算术运算、逻辑运算、关系运算、数据传输。

算法的控制结构：顺序结构、选择结构、循环结构。

算法基本设计方法：列举法、归纳法、递推、递归、减斗递推技术、回溯法。

算法复杂度：算法时间复杂度和算法空间复杂度。

算法时间复杂度是指执行算法所需要的计算工作量。

算法空间复杂度是指执行这个算法所需要的内存空间。

1.2 数据结构的基本基本概念

数据结构研究的三个方面：

（1）数据集合中各数据元素之间所固有的逻辑关系，即数据的逻辑结构；

（2）在对数据进行处理时，各数据元素在计算机中的存储关系，即数据的存储结构；

（3）对各种数据结构进行的运算。

数据结构是指相互有关联的数据元素的集合。

数据的逻辑结构包含：

（1）表示数据元素的信息；（2）表示各数据元素之间的前后件关系。

数据的存储结构有顺序、链接、索引等。

线性结构条件：

（1）有且只有一个根结点；

（2）每一个结点最多有一个前件，也最多有一个后件。

非线性结构：不满足线性结构条件的数据结构。

1．3 线性表及其顺序存储结构

线性表由一组数据元素构成，数据元素的位置只取决于自己的序号，元素之间的相对位置是线性的。在复杂线性表中，由若干项数据元素组成的数据元素称为记录，而由多个记录构成的线性表又称为文件。非空线性表的结构特征：

（1）且只有一个根结点a1，它无前件；

（2）有且只有一个终端结点an，它无后件；

（3）除根结点与终端结点外，其他所有结点有且只有一个前件，也有且只有一个后件。结点个数n称为线性表的长度，当n=0时，称为空表。

线性表的顺序存储结构具有以下两个基本特点：

（1）线性表中所有元素的所占的存储空间是连续的；

（2）线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。

ai的存储地址为：ADR(ai)=ADR(a1)+(i-1)k,，ADR(a1)为第一个元素的地址，k代表每个元素占的字节数。顺序表的运算：插入、删除。（详见14--16页）

1．4 栈和队列

栈是限定在一端进行插入与删除的线性表，允许插入与删除的一端称为栈顶，不允许插入与删除的另一端称为栈底。

栈按照“先进后出”（FILO）或“后进先出”（LIFO）组织数据，栈具有记忆作用。用top表示栈顶位置，用bottom

表示栈底。

栈的基本运算：（1）插入元素称为入栈运算；（2）删除元素称为退栈运算；（3）读栈顶元素是将栈顶元素赋给一个指定的变量，此时指针无变化。

队列是指允许在一端（队尾）进入插入，而在另一端（队头）进行删除的线性表。Rear指针指向队尾，front指针指向队头。

队列是“先进行出”（FIFO）或“后进后出”（LILO）的线性表。

队列运算包括（1）入队运算：从队尾插入一个元素；（2）退队运算：从队头删除一个元素。

循环队列：s=0表示队列空，s=1且front=rear表示队列满

1．5 线性链表：数据结构中的每一个结点对应于一个存储单元，这种存储单元称为存储结点，简称结点。结点由两部分组成：（1）用于存储数据元素值，称为数据域；（2）用于存放指针，称为指针域，用于指向前一个或后一个结点。

在链式存储结构中，存储数据结构的存储空间可以不连续，各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致，而数据元素之间的逻辑关系是由指针域来确定的。

链式存储方式即可用于表示线性结构，也可用于表示非线性结构。

线性链表，HEAD称为头指针，HEAD=NULL（或0）称为空表，如果是两指针：左指针（Llink）指向前件结点，右指针（Rlink）指向后件结点。

线性链表的基本运算：查找、插入、删除。

1．6 树与二叉树

树是一种简单的非线性结构，所有元素之间具有明显的层次特性。

在树结构中，每一个结点只有一个前件，称为父结点，没有前件的结点只有一个，称为树的根结点，简称树的根。每一个结点可以有多个后件，称为该结点的子结点。没有后件的结点称为叶子结点。

在树结构中，一个结点所拥有的后件的个数称为该结点的度，所有结点中最大的度称为树的度。树的最大层次称为树的深度。

二叉树的特点：（1）非空二叉树只有一个根结点；（2）每一个结点最多有两棵子树，且分别称为该结点的左子树与右子树。

二叉树的基本性质：

（1）在二叉树的第k层上，最多有2k-1(k≥1)个结点；

（2）深度为m的二叉树最多有2m-1个结点；

（3）度为0的结点（即叶子结点）总是比度为2的结点多一个；

（4）具有n个结点的二叉树，其深度至少为[log2n]+1,其中[log2n]表示取log2n的整数部分；

（5）具有n个结点的完全二叉树的深度为[log2n]+1；

（6）设完全二叉树共有n个结点。如果从根结点开始，按层序（每一层从左到右）用自然数1，2，?.n给结点进行编号（k=1,2?.n），有以下结论：

①若k=1，则该结点为根结点，它没有父结点；若k>1，则该结点的父结点编号为INT(k/2)；

②若2k≤n，则编号为k的结点的左子结点编号为2k；否则该结点无左子结点（也无右子结点）；

③若2k+1≤n，则编号为k的结点的右子结点编号为2k+1；否则该结点无右子结点。

满二叉树是指除最后一层外，每一层上的所有结点有两个子结点，则k层上有2k-1个结点深度为m的满二叉树有2m-1个结点。

完全二叉树是指除最后一层外，每一层上的结点数均达到最大值，在最后一层上只缺少右边的若干结点。二叉树存储结构采用链式存储结构，对于满二叉树与完全二叉树可以按层序进行顺序存储。

二叉树的遍历：

（1）前序遍历（DLR），首先访问根结点，然后遍历左子树，最后遍历右子树；

（2）中序遍历（LDR），首先遍历左子树，然后访问根结点，最后遍历右子树；

（3）后序遍历（LRD）首先遍历左子树，然后访问遍历右子树，最后访问根结点。

1．7 查找技术

顺序查找的使用情况：

（1）线性表为无序表；（2）表采用链式存储结构。

二分法查找只适用于顺序存储的有序表，对于长度为n的有序线性表，最坏情况只需比较log2n次。

1．8 排序技术

排序是指将一个无序序列整理成按值非递减顺序排列的有序序列。

交换类排序法：（1）冒泡排序法，需要比较的次数为n(n-1)/2；（2）快速排序法。

插入类排序法：（1）简单插入排序法，最坏情况需要n(n-1)/2次比较；（2）希尔排序法，最坏情况需要O(n1.5)次比较。

选择类排序法：（1）简单选择排序法,

最坏情况需要n(n-1)/2次比较；（2）堆排序法，最坏情况需要O(nlog2n)次比较。

第二章：1.算法的4个特性是：确定性，可行性，有穷性，拥有足够的情报

2.一个算法通常由两种基本要素组成：一是对数据对象的运算和操作，二是算法的控制结构。

3.算法设计的基本方法主要有：列举法，归纳法，递推，递归和减半递推技术

4.常用的存储结构有：顺序，链接，索引

5.堆排序：nlog2(n)

快速排序：n(n-1)/2 最坏

6.数据流程图中：箭头数据流

程序流程图中：箭头事物流

7.数据库系统在其内部三级模式：概念模式，内部模式，外部模式；

8.过程设计语言（PDL）是结构化的英语和伪码，是一种混合语言

9.用户参与物理设计的内容有索引设计，集簇设计和分区设计等三种

10.衡量模块独立程度的度量标准：耦合和内聚

11.程序设计主要经过了结构化的程序设计和面向对象的程序设计

12.数据库设计包括：概念设计和逻辑设计

13.数据库的物理结构主要指数据库的存储记录格式，存储记录安排和存取方法

14.数据库的建立包括数据模式的建立与数据加载

15.数据库设计一般采用生命周期法

16.源程序文档化时程序应加注释。注释一般分为序言性注释和功能性注释

17.结构化程序设计的主要特点是每个控制结构只有一个入口和一个出口

18.结构化程序设计的主要方法是自顶向下，逐步求精，模块化，限制使用GOTO语句

19.在面向对象的方法中，类的实例成为对象

20.在面向对象的方法中，直接反映了用户对目标系统的要求的模型是功能模型

21.对象有三种成分：标识，属性和方法

22.软件工程研究的主要内容：软件开发技术和软件工程管理

23.软件工程的三要素：方法，工具和过程

24.软件是程序，数据和文档的集合

25.软件工程的原则包括：抽象，信息隐蔽，模块化，局部化，确定性，一致性，完备性和可验证性

26.结构化方法的核心和基础是结构化程序设计理论

27.软件需求分析阶段的工作：需求获取，需求分析，编写需求规格说明书，需求评审

28.在结构化分析方法中，用于描述系统中所用到的全部数据和文件的文档称为数据字典

29.软件需求规格说明书是需求分析阶段的最后成果

30.软件设计的基本原则：抽象，模块化，信息隐蔽，模块独立性

31.数据流程图的类型：变换型和事务型

32.好的软件设计结构通常顶层高扇出，中间扇出较少，底层高扇出

33.详细设计的方法主要是结构化程序设计

34.常用图形描述工具有程序流程图，盒图盒问题分析图

35.详细设计的典型语言描述工具是PDL

36.结构化程序设计主要强调的是程序的易读性

37.在软件生命周期中，能准确的确定软件系统必须做什么和必须具备哪些功能的阶段是需求分析

38.关系表中每一个横行称为一个元组

39.对象是属性和方法的封装体，操作是对象的动态性属性

40.在数据管理技术的发展过程中，经历了人工管理阶段，文件系统阶段和数据库系统阶段，其中数据独立性最高的是数据库系统

41.用树形结构来表示实体之间联系的模型成为层次模型

42.关系数据库管理系统能使现的专门关系运算包括选择，投影，连接

43.数据的存储结构是指数据的逻辑结构在计算机中的表示

44.检查软件产品是否符合需求定义的过程称为确认测试

45.需求分析常用工具DFD

46.索引属于内模式

47.在关系数据库中，用来表示实体之间关系的是二维表

48.将E－R图转换到关系模式时，实体与联系都可以表示成关系

49.希尔排序法属于插入类排序法

50.诊断和改正程序中错误的工作通常称为程序调试

51.问题处理方案的正确而完整的描述称为算法

52.白盒测试一般适用于单元测试

53.数据就是描述事物的符号记录

54.数据库应用系统由数据库系统，应用软件和应用界面组成

55.数据模型所描述的内容：数据结构，数据操作，数据约束。

56.数据库的物理结构主要指数据库的存储记录格式，存储记录安排和存取方法

57.数据独立性是数据与程序间的互不依赖性，即数据库中数据独立于应用程序而不依赖于应用程序。也就是说，数据的逻辑结构、存储结构与存取方式的改变不会影响应用程序。

58.面向对象的方法包括：对象，继承，类

59.能够给出数据库物理存储结构与物理存取方法的是内模式

60.软件的调试方法主要有：强行排错法、回溯法和原因排除法

61.数据字典是各类数据描述的集合，它通常包括5个部分，即数据项，是数据的最小单位；数据结构，是若干数据项有意义的集合；数据流，可以是数据项，也可以是数据结构，表示某一处理过程的输入或输出；数据存储，处理过程中存取的数据，常常是手工凭证、手工文档或计算机文件；处理过程。

62.软件具有以下特点：①软件是一种逻辑实体，而不是物理实体，具有抽象性；②软件的生产过程与硬件不同，它没有明显的制作过程；③软件在运行、使用期间不存在磨损、老化问题；④软件的开发、运行对计算机系统具有依赖性，受计算机系统的限制，这导致软件移植的问题；⑤软件复杂性高，成本昂贵；⑥软件开发涉及诸多的社会因素。

63.在结构化方法中，软件功能分解属于下列软件开发中的阶段是总体设计

64.SQL语言又称为结构化查询语

65.数据处理的最小单位是数据项

66.数据库设计是数据库应用的核心

67.数据流的类型有变换型和事务型

68.数据库系统中实现各种数据管理功能的核心软件称为数据库管理系统

69.面向对象的设计方法与传统的的面向过程的方法有本质不同，它的基本原理是使用现实世界的概念抽象地思考问题从而自然地解决问题

70.数据模型所描述的内容有3个部分，它们是数据结构、数据操作和数据约束。其中，数据模型中的数据结构主要描述数据的类型、内容、性质，以及数据库的联系等；数据操作主要是描述在相应数据结构上的操作类型与操作方式。

71.栈的基本运算有三种：入栈、退栈和读出栈顶元素

72.视图设计一般有3种设计次序，它们分别是自顶向下、自底向上和由内向外

73.在面向对象方法中，信息隐蔽是通过对象的封装性来实现的。

74.软件维护活动包括以下几类：改正性维护、适应性维护、完善性维护和预防性维护。

75.数据库管理系统常见的数据模型有层次模型、网状模型和关系模型

76.顺序存储方法是把逻辑上相邻的结点存储在物理位置也相邻的存储单元中

相关推荐

公共基础知识总结

专栏推荐