数据结构总结

排序算法总结

一.综述

学的排序算法有:插入排序,合并排序,冒泡排序,选择排序,希尔排序,堆排序,快速排序,计数排序,基数排序。

1.所谓排序稳定就是指:如果两个数相同,对他们进行的排序结果为他们的相对顺序不变。例如A={1,2,1,2,1}这里排序之后是A = {1,1,1,2,2} 稳定就是排序后第一个1就是排序前的第一个1,第二个1就是排序前第二个1,第三个1就是排序前的第三个1。同理2也是一样。这里用颜色标明了。不稳定呢就是他们的顺序不应和开始顺序一致。也就是可能会是A={1,1,1,2,2}这样的结果。

2.原地排序:原地排序就是指不申请多余的空间来进行的排序,就是在原来的排序数据中比较和交换的排序。例如快速排序,堆排序等都是原地排序,合并排序,计数排序等不是原地排序。

3.快速排序是最好的,时间复杂度:n*log(n),不稳定排序。原地排序。适用范围广,速度快。

4.插入排序:n*n的时间复杂度,稳定排序,原地排序。

5.冒泡排序,n*n的时间复杂度,稳定排序,原地排序。因为他简单,稳定排序,而且好实现,所以用处也是比较多的。加上哨兵之后他可以提前退出。

6.选择排序,n*n的时间复杂度, 稳定排序,原地排序。选择排序就是冒泡的基本思想,从小的定位,一个一个选择,直到选择结束。他和插入排序是一个相反的过程,插入是确定一个元素的位置,而选择是确定这个位置的元素。他的好处就是每次只选择确定的元素,不会对很多数据进行交换。所以在数据交换量上应该比冒泡小。

7.插入排序,选择排序,冒泡排序的比较,他们的时间复杂度都是n*n。我觉得他们的效率也是差不多的,我个人喜欢冒泡一些,因为要用它的时候数据多半不多,而且可以提前的返回已经排序好的数组。而其他两个排序就算已经排好了,他也要做全部的扫描。在数据的交换上,冒泡的确比他们都多。

8.合并排序:n*log(n)的时间复杂度, 稳定排序,非原地排序。他的思想是分治,先分成小的部分,排好部分之后合并,因为我们另外申请的空间,在合并的时候效率是0(n)的。速度很快。貌似他的上限是n*log(n),所以如果说是比较的次数的话,他比快速排序要少一些。对任意的数组都能有效地在n*log(n)排好序。但是因为他是非原地排序,所以虽然他很快,但是貌似他的人气没有快速排序高。

9.堆排序:n*log(n)的时间复杂度, 非稳定排序,原地排序。他的思想是利用的堆这种数据结构,堆可以看成一个完全二叉树,所以在排序中比较的次数可以做到很少。加上他也是原地排序,不需要申请额外的空间,效率也不错。可是他的思想感觉比快速难掌握一些。还有就是在已经排好序的基础上添加一个数据再排序,他的交换次数和比较次数一点都不会减少。虽然堆排序在使用的中没有快速排序广泛,但是他的数据结构和思想真的很不错,而且用它来实现优先队列,效率没得说。

10.希尔排序:时间复杂度n^lamda(1 < lamda < 2), lamda和每次步长选择有关, 非稳定排序,原地排序。主要思想是分治,不过他的分治和合并排序的分治不一样,他是按步长来分组的,而不是想合并那样左一半右一半。开始步长为整个的长度的一半。分成nLen/2个组,然后每组排序。接个步长减为原来的一半在分组排序,直到步长为1,排序之后希尔排序就完成了。这个思路很好,据说是插入排序的升级版,所以在实现每组排序的时候我故意用了插入排序。我觉得他是一个特别好的排序方法了。他的缺点就是两个数可能比较多次,因为两个数据会多次分不过他们不会出现数据的交换。效率也是很高的。

11.快速排序,堆排序,合并排序,希尔排序的比较,他们的时间复杂的都是n*log(n),在使用上快速排序最广泛,他原地排序,虽然不稳定,可是很多情况下排序根本就不在意他是否稳定。他的比较次数是比较小的,因为他把数据分成了大和小的两部分。每次都确定了一个数的位置,所以理论上说不会出现两个数比较两次的情况,也是在最后在交换数据,说以数据交换上也很少。合并排序和堆排序也有这些优点,但是合并排序要申请额外的空间。堆排序堆已经排好的数据交换上比快速多。所以目前快速排序用的要广泛的多。还有他很容易掌握和实现。

冒泡:好实现,速度不慢,使用于轻量级的数据排序。

插入排序:也使用于小数据的排序,但是我从他的思想中学到怎么插入一个数据。呵呵,这样就知道在排好的数据里面,不用再排序了,而是直接调用一下插入就可以了。

选择排序:我学会了怎么去获得最大值,最小值等方法。只要选择一下,不就可以了。 合并排序:我学会分而治之的方法,而且在合并两个数组的时候很适用。

堆排序:可以用它来实现优先队列,而且他的思想应该给我加了很多内力。

快速排序:本来就用的最多的排序,对我的帮助大的都不知道怎么说好。

希尔排序:也是分治,让我看到了分治的不同,原来还有这种思想的存在。

二,分述

以下这个main函数是所有排序算法的测试部分,公用:

27 int main()

28 {

29 int nData[10] = {4,10,9,8,7,6,5,4,3,2}; //创建10个数据,测试

30 InsertionSort(nData, 10); //此处调用插入排序

31

32 for (int i = 0; i < 10; ++i)

33 {

34 printf("%d ", nData[i]);

34 }

36

37 printf("\n");

38 system("puase");

39 return 0;

40 }

插入排序,插入排序主要思想是:把要排序的数字插入到已经排好的数据中。

例如12356是已经排好的序,我们将4插入到他们中,时插入之后也是排好序的。这里显而易见

是插入到3的后面。变为123456.

实现思路:插入排序就是先是一个有序的数据,然后把要插入的数据插到指定的位置,而排序首先给的就

是无序的,我们怎么确定先得到一个有序的数据呢?答案就是:如果只有一个,当然是有序的咯。我们先

拿一个出来,他是有序的,然后把数据一个一个插入到其中,那么插入之后是有序的,所以直到最后都是

有序的。

以下这个程序的毛病是循环太多了,不过已经很好的说明了排序的主要思想。

#include <stdio.h>

2 #include <stdlib.h>

3

4 //插入排序从下到大,nData为要排序的数据,nNum为数据的个数,该排序是稳定的排序 5 bool InsertionSort(int nData[], int nNum)

6 {

7 for (int i = 1; i < nNum; ++i) //遍历数组,进行插入排序

8 {

9 int nTemp = nData[i];

10 for (int j = 0; j < i; ++j) //对该数,寻找他要插入的位置

11 {

12 if (nData[j] > nTemp) //找到位置,然后插入该位置,之后的数据后移 13 {

14 for (int k = i; k > j; --k) //数据后移

15 {

16 nData[k] = nData[k -1];

17 }

18 nData[j] = nTemp; //将数据插入到指定位置

19 break;

20 }

21 }

22 }

23

24 return true;

25 }

26

冒泡排序的主要思路:

我们把要排序的数组A = {3,4,2,1} 看成一组水泡,就像冒泡一样,轻的在上面,重的在下面,换成数据,就是小的在上面,大的在下面。 我们先把最轻的冒出到顶端,然后冒出第二轻的在最轻的下面,接着冒出第三轻的。依次内推。直到所有都冒出来了为止。怎么做到把最轻的放在顶端呢?我们从最底下的数据开始冒,如果比他上面的数据小,就交换(冒上去),然后再用第二第下的数据比较(此时他已经是较轻的一个),如果他比他上面的小,则交换,把小的冒上去。直到比到第一位置,得到的就是最轻的数据咯,这个过程就像是冒泡一样,下面的和上面的比较,小的冒上去。大的沉下来

画个图先:

最初 第一次结果 第二次结果 第三次结果

3 3 3 1

4 4 1 3

2 1 4 4

1 2 2 2

开始:1 和2 比,1比2小,浮上,然后1跟4比,再1跟3比,这样结构就变为1,3,4,

2。最小的位置确定了,然后我们确定第二小的,同理2 vs 4, 2 vs 3 得到2, 再确定第3小数据,3 vs 4得到3,最后就是4为最大的数据,冒泡就排好了。

//冒泡排序, pnData要排序的数据, nLen数据的个数

int BubbleSort(int* pnData, int nLen)

{ bool isOk = false; //设置排序是否结束的哨兵

//i从[0,nLen-1)开始冒泡,确定第i个元素

for (int i = 0; i < nLen - 1 && !isOk; ++i)

{ isOk = true; //假定排序成功

//从[nLen - 1, i)检查是否比上面一个小,把小的冒泡浮上去

for (int j = nLen- 1; j > i; --j)

{

if (pnData[j] < pnData[j - 1]) //如果下面的比上面小,交换

{

int nTemp = pnData[j];

pnData[j] = pnData[j - 1];

pnData[j - 1] = nTemp;

isOk = false;

}

}

}

return 1;

}

选择排序,选择排序和冒泡排序思路上有一点相似,都是先确定最小元素,再确定第二笑元素,最后确定最大元素。他的主要流程如下:

1假如一个数组A = {5,3,6,2,4,7},我们对他进行排序

2.确定最小的元素放在A[0]位置,我们怎么确定呢,首先默认最小元素为5,他的索引为0,然后用它跟3比较,比他打,则认为最小元素为3,他的索引为1,然后用3跟6比,发现比他小,最小元素还是3,然后跟2比,最小元素变成了2,索引为3,然后跟4比,跟7比。当比较结束之后,最小元素也尘埃落定了。就是2,索引为3,然后我们把他放在A[0]处。为了使A[0]原有数据部丢失,我们使A[0](要放的位置) 与A[3](最小数据的位置)交换。这样就不可以了吗?

3.然后我们在来找第二小元素,放在A[1],第三小元素,放在A[2]。。当寻找完毕,我们排序也就结束了。

4.不过,在找的时候要注意其实位置,不能在找A[2]的时候,还用A[2]的数据跟已经排好的A[0],A[1]比,一定要跟还没有确定位置的元素比。还有一个技巧就是我们不能每次都存元素值和索引,我们只存索引就可以了,通过索引就能找到元素了。

5.他和冒泡的相似和区别,冒泡和他最大的区别是他发现比他小就交换,把小的放上面,而选择是选择到最小的在直接放在确定的位置。选择也是稳定的排序。

//选择排序, pnData要排序的数据, nLen数据的个数

int SelectSort(int* pnData, int nLen)

{

//i从[0,nLen-1)开始选择,确定第i个元素

for (int i = 0; i < nLen - 1; ++i)

{

int nIndex = i;

//遍历剩余数据,选择出当前最小的数据

for (int j = i + 1; j < nLen; ++j)

{

if (pnData[j] < pnData[nIndex])

{

nIndex = j;

}

}

//如果当前最小数据索引不是i,也就是说排在i位置的数据在nIndex处 if (nIndex != i)

{

//交换数据,确定i位置的数据。

int nTemp = pnData[i];

pnData[i] = pnData[nIndex];

pnData[nIndex] = nTemp;

}

}

return 1;

}

常用的数据结构

线性表(n个数据元素的有限集合)是一种逻辑结构,它的特点:

(1)存在唯一的一个被称做“第一个”的数据元素;

(2)存在唯一的一个被称做“最后一个”的数据元素;

(3)除第一个之外,集合中的每个数据元素均只有一个前驱;

(4)除最后一个之外,集合中每个数据元素均只有一个后继。

线性表的存储结构包括两种:顺序存储、链式存储。顺序存储是指在内存中分配一块连续的空间,用来存储线性表的元素;链式存储是指线性表的各元素在内存中不是连续存储,每个元素可以找到自己的前驱或者后继。

线性表的逻辑结构包括栈、队列、数组、链表、串等。

数组(连续的存储单元)、链表(非连续的存储单元,每个存储单元包括<数据域,指针域>)都表示线性表的存储结构。

栈(限定仅在表尾进行插入或删除操作的线性表)也是一种线性表,但它不表示存储结构。栈可以由数组或者链表实现其存储结构。栈的应用场景:数制转换、行编辑(删除字符)、表达式求值、浏览器的历史访问记录(后退为出栈,点连接为入栈)、函数调用、蒸馒头(最上面屉的馒头先熟)等。

队列(一种先进先出的线性表)是一种线性表的逻辑结构。在队列中,允许插入的的一端叫队尾,允许删除的一端则称为队头。队列的存储也可以由数组或链表实现(链队列),比较

常用的是链队列。队列的应用场景:排队、请求处理队列等。

二叉树:

顺序存储:第i号结点的左右孩子一定保存在第2i及2i+1号单元中。缺点:对非完全二叉树而言,浪费存储空间;

链式存储:一个二叉树的结点至少保存三种信息:数据元素、左孩子位置、右孩子位置。对应地,链式存储二叉树的结点至少包含三个域:数据域、左、右指针域。

遍历二叉树。【遍历方法】

遍历算法:

===============O(∩_∩)O分割线==================== 遍历算法

1.中序遍历的递归算法定义:

若二叉树非空,则依次执行如下操作:

(1)遍历左子树;

(2)访问根结点;

(3)遍历右子树。

2.先序遍历的递归算法定义:

若二叉树非空,则依次执行如下操作:

(1) 访问根结点;

(2) 遍历左子树;

(3) 遍历右子树。

3.后序遍历得递归算法定义:

若二叉树非空,则依次执行如下操作:

(1)遍历左子树;

(2)遍历右子树;

(3)访问根结点。

图解

数据结构总结

===============O(∩_∩)O分割线==================== 哈希表:一般的线性表,树中,记录在结构中的相对位置是随机的,即和记录的关键字之间不存在确定的关系,因此,在结构中查找记录时需进行一系列和关键字的比较。这一类查找方法建立在“比较“的基础上,查找的效率依赖于查找过程中所进行的比较次数。理想的情况是能直接找到需要的记录,因此必须在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和结构中一个唯一的存储位置相对应。

==================数据结构的公共基础知识============================

第一章数据结构与算法

1.1 算法

算法:是指解题方案的准确而完整的描述。

算法不等于程序,也不等计算机方法,程序的编制不可能优于算法的设计。 算法的基本特征:是一组严谨地定义运算顺序的规则,每一个规则都是有效的,是明确的,此顺序将在有限的次数下终止。特征包括:

(1)可行性;

(2)确定性,算法中每一步骤都必须有明确定义,不充许有模棱两可的解释,不允许有多义性;

(3)有穷性,算法必须能在有限的时间内做完,即能在执行有限个步骤后终止,包括合理的执行时间的含义;

(4)拥有足够的情报。

算法的基本要素:一是对数据对象的运算和操作;二是算法的控制结构。 指令系统:一个计算机系统能执行的所有指令的集合。

基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。

算法的控制结构:顺序结构、选择结构、循环结构。

算法基本设计方法:列举法、归纳法、递推、递归、减斗递推技术、回溯法。 算法复杂度:算法时间复杂度和算法空间复杂度。

算法时间复杂度是指执行算法所需要的计算工作量。

算法空间复杂度是指执行这个算法所需要的内存空间。

1.2 数据结构的基本基本概念

数据结构研究的三个方面:

(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;

(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;

(3)对各种数据结构进行的运算。

数据结构是指相互有关联的数据元素的集合。

数据的逻辑结构包含:

(1)表示数据元素的信息;

(2)表示各数据元素之间的前后件关系。

数据的存储结构有顺序、链接、索引等。

线性结构条件:

(1)有且只有一个根结点;

(2)每一个结点最多有一个前件,也最多有一个后件。

非线性结构:不满足线性结构条件的数据结构。

1.3 线性表及其顺序存储结构

线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。

在复杂线性表中,由若干项数据元素组成的数据元素称为记录,而由多个记录构成的线性表又称为文件。

非空线性表的结构特征:

(1)且只有一个根结点a1,它无前件;

(2)有且只有一个终端结点an,它无后件;

(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数n称为线性表的长度,当n=0时,称为空表。

线性表的顺序存储结构具有以下两个基本特点:

(1)线性表中所有元素的所占的存储空间是连续的;

(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。

ai的存储地址为:ADR(ai)=ADR(a1)+(i-1)k,,ADR(a1)为第一个元素的地址,k代表每个元素占的字节数。

顺序表的运算:插入、删除。 (详见14--16页)

1.4 栈和队列

栈是限定在一端进行插入与删除的线性表,允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。 栈按照“先进后出”(FILO)或“后进先出”(LIFO)组织数据,栈具有记忆作用。用top表示栈顶位置,用bottom表示栈底。

栈的基本运算:(1)插入元素称为入栈运算;(2)删除元素称为退栈运算;(3)读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。

队列是指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。Rear指针指向队尾,front指针指向队头。

队列是“先进行出”(FIFO)或“后进后出”(LILO)的线性表。

队列运算包括(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删除一个元素。

循环队列:s=0表示队列空,s=1且front=rear表示队列满

1.5 线性链表

数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。

结点由两部分组成:(1)用于存储数据元素值,称为数据域;(2)用于存放指针,称为指针域,用于指向前一个或后一个结点。

在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。

链式存储方式即可用于表示线性结构,也可用于表示非线性结构。

线性链表,HEAD称为头指针,HEAD=NULL(或0)称为空表,如果是两指针:左指针(Llink)指向前件结点,右指针(Rlink)指向后件结点。

线性链表的基本运算:查找、插入、删除。

1.6 树与二叉树

树是一种简单的非线性结构,所有元素之间具有明显的层次特性。

在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结点。没有后件的结点称为叶子结点。

在树结构中,一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。树的最大层次称为树的深度。

二叉树的特点:(1)非空二叉树只有一个根结点;(2)每一个结点最多有两棵子树,且分别称为该结点的左子树与右子树。

二叉树的基本性质:

(1)在二叉树的第k层上,最多有2k-1(k≥1)个结点;

(2)深度为m的二叉树最多有2m-1个结点;

(3)度为0的结点(即叶子结点)总是比度为2的结点多一个;

(4)具有n个结点的二叉树,其深度至少为[log2n]+1,其中[log2n]表示取log2n的整数部分;

(5)具有n个结点的完全二叉树的深度为[log2n]+1;

(6)设完全二叉树共有n个结点。如果从根结点开始,按层序(每一层从左到右)用自然数1,2,?.n给结点进行编号(k=1,2?.n),有以下结论:

①若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点编号为INT(k/2);

②若2k≤n,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(也无右子结点);

③若2k+1≤n,则编号为k的结点的右子结点编号为2k+1;否则该结点无右子结点。 满二叉树是指除最后一层外,每一层上的所有结点有两个子结点,则k层上有2k-1个结点深度为m的满二叉树有2m-1个结点。

完全二叉树是指除最后一层外,每一层上的结点数均达到最大值,在最后一层上只缺少右边的若干结点。

二叉树存储结构采用链式存储结构,对于满二叉树与完全二叉树可以按层序进行顺序存储。

二叉树的遍历:

(1)前序遍历(DLR),首先访问根结点,然后遍历左子树,最后遍历右子树;

(2)中序遍历(LDR),首先遍历左子树,然后访问根结点,最后遍历右子树;

(3)后序遍历(LRD)首先遍历左子树,然后访问遍历右子树,最后访问根结点。

1.7 查找技术

顺序查找的使用情况:

(1)线性表为无序表;

(2)表采用链式存储结构。

二分法查找只适用于顺序存储的有序表,对于长度为n的有序线性表,最坏情况只需

比较log2n次。

1.8 排序技术

排序是指将一个无序序列整理成按值非递减顺序排列的有序序列。

交换类排序法:(1)冒泡排序法,需要比较的次数为n(n-1)/2; (2)快速排序法。 插入类排序法:(1)简单插入排序法,最坏情况需要n(n-1)/2次比较;(2)希尔排序法,最坏情况需要O(n1.5)次比较。

选择类排序法:(1)简单选择排序法,

最坏情况需要n(n-1)/2次比较;(2)堆排序法,最坏情况需要O(nlog2n)次比较。

==================数据结构的公共基础知识=========================END

相关推荐