几种经典排序算法
- 插入排序
- 折半插入排序法
- 选择排序
- 冒泡排序
- 希尔排序
- 堆排序
- 二路归并排序
- 快速排序
在介绍排序之前,先来说说,研究不同的排序主要是要研究他们的哪些不同:
- 时间性能。即排序过程中元素之间的比较次数与元素移动次数。我们此次讨论各种排序方法的时间复杂度时,主要按照最差情况下所需要的比较次数来进行。
- 空间性能。除了存放参加排序的元素之外,排序过程中所需要的其他辅助空间。
- 排序稳定性。对于值相同的两个元素,排序前后的先后次序不变,则称这种排序方法稳定,否则称其不稳定。
然后还有一个概念我们后面会经常提到:趟。排序需要若干遍循环完成,每循环一遍,就叫一趟。
然后,我们今天的例子中,都是以从小到大排序为例的。
另外,因为排序免不了需要交换位置,因此我们先写好一个Swap函数用于交换:
void Swap(int* pa,int* pb)
{
int tmp=*pa;
*pa=*pb;
*pb=tmp;
}
插入排序
动画演示:
核心思想:
在第i趟排序中,将序列的第i+1个元素,按照值大小,插入到前i个已排好序的序列中。
静态演示:
将【49,38,97,76,65,13,27,50】进行插入排序:
其中红色部分表示已经排好序的部分,花圈元素表示下一趟要排序的元素。
可以看出来,n个元素,需要n-1趟插入排序才能完全排好。
算法:
我们先写一趟排序的算法,然后再加循环。加循环无外就是判断一下起始和结束条件。
void insertSort(int k[],int n)//传入要进行排序的数组以及元素数
{int i,j;//i表示第i趟,也表示当前要调整的元素的下标//j用来遍历已排好序的序列,用于和第i个元素比较int tmp=k[i];for(i=1;i<n;i++){for(j=i-1;j>=0&&k[j]>tmp;j--)k[j+1]=k[j];//以上两步用于把比当前元素大的往后调//一旦检测到已排序好序列中有比当前元素小的,则把当前元素插到该元素后面k[j+1]=tmp; }}
我们用【49,38,97,76,65,13,27,50】这个数组检测一下效果:
没毛病,跟我们刚刚手动计算的一样。
排序的时间效率:
时间效率主要和排序过程中元素之间的比较次数直接有关。
- 原始序列按值递增:那么每一趟排序,第一次比较,也就是和当前需要调整元素的前一个元素比较时,就跳出循环了,因为比当前需要调整元素小。因此每个元素进行调整时,都只需要比较1次,那么总共有n-1个元素需要调整,就一共比较n-1次。
- 原始序列按值递减:第i趟排序需要和前i个元素都比较一次,因此,整个n-1趟排序需要比较(1+n-1)*(n-1)/ 2=n(n-1)/ 2次
如果以最坏的情况,也就是原始序列递减情况,则插入排序算法的时间复杂度为O(n²)。
由于我们只把比当前元素大的元素向后调,相等的元素不调,因此调整之后,值相等的两个元素的相对位置在排序前后并未改变,则插入排序算法是稳定的。
由于没有开辟新的空间,因此插入排序算法的空复杂度为O(1)。
折半插入排序法
这个算法的整体思想和插入法一样,只是在找插入位置的时候,用了折半查找的方法,基于前i-1个元素是有序的。
找到位置的标志,也就是某一趟排序中循环停止的标志为high<low,插入位置即为low。
void BinInsertSort(int k[],int n)
{int i,j;int high,low,mid;for(i=1;i<n;i++){int tmp=k[i];high=i-1;low=0;while(high>=low){mid=(high+low)/2;if(tmp>=k[mid])//将相等情况也纳入,保证了稳定性 low=mid+1;elsehigh=mid-1;}for(j=i;j>low;j--)k[j]=k[j-1];k[low]=tmp;}
}
选择排序
动画演示:
核心思想:
第i趟排序,从序列的后n-i+1个元素中选择一个值最小的元素,将其置于该n-i+1个元素的最前面(与第i个元素交换)
静态演示:
红框框起来的表示这一趟中判断出的最小元素,红色部分表示已经排好序的部分。
共有8个元素,但只排7次。和插入排序一样。
void selectsort(int k[],int n)
{int i,j,d;//d用于记录最小元素的下标int temp;for(i=0;i<n-1;i++){d=i;for(j=i+1;j<n;j++){if(k[j]<k[d])d=j;}Swap(&k[d],&k[i]);}
}
方法2
void selectsort2(int k[],int n)
{int i,j,tmp;for(i=0;i<n;i++)for(j=i+1;j<n;j++)if(k[j]<k[i])Swap(&k[j],&k[i]);
}
冒泡排序
动画演示:
核心思想:第i趟中,对序列的**前n-i+1个元素,从第一个元素开始,相邻的两个元素比较大小,若前者大于后者,则交换。
静态演示:
我们发现,选择和插入排序都进行了n-1次,但是为什么冒泡排序小于n-1呢?前两者循环结束的条件都是i,j和n比较,但是冒泡排序,我们需要定义一个变量flag,用于记录,在某趟排序中,是否进行了元素交换。如果进行了,哪怕只有一次,那下一趟循环继续;如果一次也没有,就说明此时序列已经有序,不需要再进行下一趟了。
void bubblesort(int k[],int n)
{int i,j,flag=1;for(i=n-1;i>0&&flag==1;i--){flag=0;for(j=0;j<i;j++){if(k[j]>k[j+1]){Swap(&k[j],&k[j+1]);flag=1;} }}
}
效率分析:
冒泡排序算法的排序趟数和原始序列的排序有关,因此排序趟数为【1,n-1】。
排序趟数最少为1次,即原始序列本身就有序。
最多为n-1次,原始序列为逆序。
因此,冒泡排序的时间复杂度,在最少次数下为O(n),即只进行一轮;在最多次数下为O(n²)
冒泡排序过程中,如果两个数相等,则不进行交换,因此是稳定的。
希尔排序
把整个序列分成若干子序列,每个子序列内部先排序。
在每一趟排序结果均是按照上一趟分好的组(颜色一眼的)进行组内排序的结果(组内排序可以用各种排序方法,插入、冒泡都行)。
每组元素的间隔数满足:
即每一次的gap都是上一次的一半。gap等于1时,整个数组为一个组进行排序,也就是最后一次排序。
每进行一趟排序,数组都会更加接近有序。
我们这里先展示一种组内排序为冒泡排序的希尔排序方法:
void shellsort1(int k[],int n)
{int i,j,flag,gap=n;//flag用于检测每一趟冒泡排序是否有进行交换,如果没有进行交换,就说明//数组已经有序了,不用继续进行排序了int temp;while(gap>1){gap=gap/2;do{flag=0;for(i=0;i<n-gap;i++){j=i+gap;if(k[j]<k[i])Swap(&k[i],&k[j]);} } while (flag==1); }
}
再来展示一种内部排序为插入排序的希尔排序:
void shellsort2(int k[],int n)
{int i,j,temp,gap=n;while(gap>1){gap=gap/2;for(i=gap;i<n;i++){temp=k[i];for(j=i;j>=gap&&k[j-gap]>temp;j-=gap)k[j]=k[j-gap];k[j]=temp;}}
}
效率分析:
举个反例就发现,希尔排序是不稳定的了:
【2a,3,4,1,2b,5,6,8】我们让gap=3,则【2a,1,6】是一组,【3,2b,8】是一组,【4,5】一组。
那么第一趟排序的结果就是:
【1,2b,4,2a,3,5,6,8】我们发现,两个2的相对位置发生了变化,因此不稳定。
希尔排序的时间复杂度比较难搞,我们认为在O(nlogn)和O(n²)之间。
堆排序
之前写过一篇专门讲堆排序的文章:link,但是在本次排序专题里,再把它写一次。
动画演示:
核心思想:先对原始数组进行向下调整,从第一个非叶子结点开始进行。待所有结点都调整完毕之后,形成了一个大堆,然后,依次将堆顶和当前堆的最后个元素交换位置,换完之后进行向下调整。
void AjustDown(int k[],int n,int parent)
{int child=2*parent+1;while(child<n){if(child+1<n&&k[child+1]>k[child])++child;if(k[child]>k[parent]){Swap(&k[child],&k[parent]);parent=child;child=child*2+1;}elsebreak;}
}
void heapsort(int k[],int n)
{for(int i=(n-1-1)/2;i>=0;i--){AjustDown(k,n,i);}//建好堆了,下面开始排序int end=n-1;while(end>0){Swap(&k[end],&k[0]);AjustDown(k,end,0);end--;}
}
效率分析
时间主要消耗在向下调整了,那么每个元素,都要经过向下调整,调整的次数最多为高度次,即logn,有n个元素,则时间复杂度为O(nlogn)。
堆排序显然也不稳定,调整算法压根没有考虑过数组之间的关系,只考虑了堆的结构。
二路归并排序
动画演示:
核心思想:
第i趟排序将序列的n/2^ (i-1) 个长度为 2^ (i-1) 的有序子序列依次两两合并为n/2^ i 个长度为2^i的有序子序列。
静态演示:
如果n不等于2^ k,则:
最后一趟在不等长的两个序列中进行就可以。
大家看到这个基本思路,就知道它大概率是要用到递归的思路的,这种一环套一环,每一环的都基于上一环的结果。
从动态图中我们也能看出来,归并排序是需要一个临时数组的,辅助我们为子序列排序。
void _mergesort(int k[],int begin,int end,int* tmp)
{if(begin==end)return;int mid=(begin+end)/2;//[begin,mid][mid+1,end]_mergesort(k,begin,mid,tmp);_mergesort(k,mid+1,end,tmp);//左右都排好以后,我们来合并:int begin1=begin,end1=mid;int begin2=mid+1,end2=end;int i=begin1;while(begin1<=end1&&begin2<=end){if(k[begin1]<k[begin2])tmp[i++]=k[begin1++];elsetmp[i++]=k[begin2++];}while(begin1<=end1)tmp[i++]=k[begin1++];while(begin2<=end2)tmp[i++]=k[begin2++];memcpy(k+begin,tmp+begin,sizeof(int)*(end-begin+1));
}
void mergesort(int k[],int n)
{int* tmp=(int*)malloc(sizeof(int)*n);_mergesort(k,0,n-1,tmp);free(tmp);tmp=NULL;
}
效率分析:
当子序列个数为1(n不是2的次幂时为2个),即n/2^ i 为1的时候,排序完成,即排了logn趟。子序列内部排序的时间复杂度主要来源于归并部分的while循环,时间复杂度为O(n),因此,归并排序的时间复杂度为O(nlogn)。
由于开辟了tmp数组,因此空间复杂度时O(n)。
是稳定的。
快速排序
动画演示:
为什么右边的先走呢?因为右边的先走可以保证L和R相遇的位置处元素,一定小于key。
void quicksort(int k[],int left,int right)
{if(left>=right)return;int begin=left,end=right;int keyi=left;while(left<right){//right先走,找比key小的while(left<right&&k[keyi]<=k[right])//为了防止整个序列里面keyi的右边全部比它大,加一个left<right,以防right一股脑冲出数组头right--;//left再走,找比key大的while(left>right&&k[keyi]>=k[left])left++;Swap(&k[left],&k[right]);}Swap(&k[left],&k[keyi]);keyi=left;//[begin,keyi-1][keyi+1,end]quicksort(k,begin,keyi-1);quicksort(k,keyi+1,end);
}
效率分析: