排序的概念
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。 外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
常见排序算法的实现(全部以升序为例)
1.插入排序
1.1 基本思想:
直接插入排序是一种简单的插入排序法,其基本思想:
把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。
实际中我们玩扑克牌时,就用了插入排序的思想,在排序自己手中的扑克牌时经常会这样排。
1.2 1️⃣直接插入排序:
当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移。
直接插入排序的特性总结:
1.3 2️⃣希尔排序( 缩小增量排序)
希尔排序法又称缩小增量法。
希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成多个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取不同的gap,重复上述分组和排序的工作。
gap>1时在做预排序,当到达gap=1时相当于做直接插入排序,所有记录在统一组内排好序。
2. 选择排序
2.1基本思想:
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。
2.2 3️⃣直接选择排序:
在元素集合array[i]–array[n-1]中选择关键码最大(小)的数据元素若它不是这组元素中的最后一个(第一个)元素,则将它与这组元素中的最后一个(第一个)元素交换在剩余的array[i]–array[n-2](array[i 1]–array[n-1])集合中,重复上述步骤,直到集合剩余1个元素。
在这我们写一种优化一点的,我们同时选出最大的和最小的,跟第一个数和最后一个数交换,效率提高了一倍。但也出现了一些问题:
2.3 4️⃣堆排序
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
3. 交换排序
3.1基本思想:
所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。
3.2 5️⃣冒泡排序
冒泡排序,我们的老朋友了。依次比较两个相邻的元素,如果顺序不符合要求,就交换位置。走访元素的工作是重复地进行直到没有相邻元素需要交换,也就是说该元素列已经排序完成。
这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端(升序或降序排列),就如同碳酸饮料中二氧化碳的气泡最终会上浮到顶端一样,故名“冒泡排序”。
在这里我们加一个exchange来判断待排序数列是否已经有序(不交换就是已经有序了),这样的一定程度上提高效率。
3.3 6️⃣快速排序
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止
上述为快速排序递归实现的主框架,发现与二叉树前序遍历规则非常像,大家在写递归框架时可想想二叉树前序遍历规则即可快速写出来,后续只需分析如何按照基准值来对区间中数据进行划分的方式即可。
将区间按照基准值划分为左右两半部分的常见方式有三种:
1️⃣ hoare版本
理解上可能会有的问题:
偶数个数会不会相遇不上?不会,每次都有一边静止,只有一边在移动,一定能追上。
(key取左边)相遇位置的值与key交换,那么如何保证相遇位置的值比key小?右边先走就能保证这里要停下来,只有有两种情况:
right先停下(停在比key小的地方),left开始走,并且跟right相遇了
或者left先停下(并跟right交换),然后right开始走,right没有找到比key小的,直接跟left相遇了。这两种情况相遇位置的值都比key小。
如果key取右边,左边先走才能保证相遇位置的值比key大。
2️⃣ 挖坑法
挖坑法 VS hoare版本
效率上来说:两者区别不大
挖坑法的优势是:更容易理解!(如果key取左边)很自然的就右边先走,找小,放到左边的坑里······hoare版本理解上更有难度。
3️⃣ 前后指针版本
prev和cur之间间隔的值都比key大,所以prev和cur交换才能逐步把大的换到右侧,把小的换到左侧
3.3.1 快速排序优化
1️⃣如果每次选出的key都是最小或最大的会使效率大大降低。例如:1 2 3 4 5 6 这种已经顺序了的,取最左或者最右都会很慢,于是我们想到能否选出一个不是最大也不是最小的数做key。
三数取中法选key
最左,最右,中间三个位置的数进行比较,选出中等大小的那个做key
2️⃣快排的结构是类似于二叉树的,二叉树最后几层的数是最多的,排序难度也很低,是否能够不递归到最小区间,中途就运用另一种排序方法返回有序数组给上一层来优化呢?当然是可以的。
小区间优化:递归到小的子区间时,可以考虑使用插入排序 ,减少递归调用。
3.3.2 快速排序非递归
栈的代码可以到我之前的博文找 ,当然你如果会C 的话一切就更简单了。
4. 7️⃣归并排序
基本思想:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。(有微积分那味了)
4.1 归并排序非递归
5. 非比较排序
5.1 8️⃣计数排序
思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。
操作步骤:
1.统计相同元素出现次数
2.根据统计的结果将序列回收到原来的序列中
5.2 9️⃣桶排序
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。桶排序 (Bucket sort)的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排)。
操作步骤:
1.设置一个定量的数组当作空桶;
2.每个桶存放该区间的数据,由于每个桶内的数据元素个数不确定,可以使用链表表示,同时使用插入排序,让每个桶的链表有序。
3.这样按照次序将所有桶的元素连起来就得到完整的有序列表。