基本思想
设当前待排序的数组无序区为R[low..high],利用分治法可将快速排序的基本思想描述为:
- 分解:
在R[low..high]中任选一个记录作为基准(Pivot),以此基准将当前无序区划分为左、右两个较小的子区间R[low..pivotpos-1)和R[pivotpos+1..high],并使左边子区间中所有记录的关键字均小于等于基准记录(不妨记为pivot)的关键字pivot.key,右边的子区间中所有记录的关键字均大于等于pivot.key,而基准记录pivot则位于正确的位置(pivotpos)上,它无需参加后续的排序。
注意:划分的关键是要求出基准记录所在的位置pivotpos,划分的结果可以简单地表示为(注意pivot=R[pivotpos]):
R[low..pivotpos-1].keys ≤ R[pivotpos].key ≤ R[pivotpos+1..high].keys
其中low≤pivotpos≤high。
- 求解:
通过递归调用快速排序对左、右子区间R[low..pivotpos-1]和R[pivotpos+1..high] 快速排序。
- 组合:
因为当“求解”步骤中的两个递归调用结束时,其左、右两个子区间已有序。对快速排序而言, “组合”步骤不需要做什么,可看作是空操作。
算法实现
快速排序算法,Java实现,代码如下所示:
public abstract class Sorter { public abstract void sort(int[] array); } public class QuickSorter extends Sorter { @Override public void sort(int[] array) { quickSort(array, 0, array.length - 1); } /** * 通过划分,基于分治思想,递归执行子任务排序最后合并 * @param low 数组首位置索引 * @param high 数组末位置索引 */ private void quickSort(int[] array, int low, int high) { int pivotPos; // 划分基准元素索引 if (low < high) { pivotPos = partition(array, low, high); quickSort(array, low, pivotPos - 1); // 左划分递归快速排序 quickSort(array, pivotPos + 1, high); // 右划分递归快速排序 } } /** * 简单划分方法 * @param i * @param j * @return */ private int partition(int[] array, int i, int j) { Integer pivot = array[i]; // 初始基准元素,如果quickSort方法第一次调用,pivot初始为数组第一个元素 while (i < j) { // 两个指针从两边向中间靠拢,不能相交 // 右侧指针向左移动 while (j > i && array[j] >= pivot) { j--; } if (i < j) { // 如果在没有使指针i和j相交的情况下找到了array[j] >= 基准元素pivot array[i] = array[j]; // 基准元素放到了j指针处 i++; // 左侧i指针需要向右移动一个位置 } // 左侧指针向右移动 while (i < j && array[i] <= pivot) { i++; } if (i < j) { // 如果在没有使指针i和j相交的情况下找到了array[i] <= 基准元素pivot array[j] = array[i]; // 基准元素放到了i指针处 j--; // 右侧j指针需要向左移动一个位置 } } array[i] = pivot; // 将基准元素放到正确的排序位置上 return i; } }
快速排序算法,Python实现,代码如下所示:
class Sorter: ''' Abstract sorter class, which provides shared methods being used by subclasses. ''' __metaclass__ = ABCMeta @abstractmethod def sort(self, array): pass class QuickSorter(Sorter): ''' Quick sorter ''' def sort(self, array): length = len(array) self.__quick_sort(array, 0, length - 1) def __quick_sort(self, array, low, high): if low<high: pivotPos = self.__partition(array, low, high) self.__quick_sort(array, low, pivotPos - 1) self.__quick_sort(array, pivotPos + 1, high) def __partition(self, array, i, j): pivot = array[i] while i<j: # right side pointer moves to left while j>i and array[j]>=pivot: j = j - 1 if i<j: array[i] = array[j] i = i + 1 # left side pointer moves to right while i<j and array[i]<=pivot: i = i + 1 if i<j: array[j] = array[i] j = j - 1 # put the pivot element to the right position array[i] = pivot return i
排序过程
采用分治的思想对待排序数组进行划分。分治法的基本思想是:
将原问题分解为若干个规模更小但结构与原问题相似的子问题。递归地解这些子问题,然后将这些子问题的解组合为原问题的解。
快速排序,主要是求得一个合理的划分,从而基于此划分来分治排序。使用简单划分方法的思想是:
第一步:
设置两个指针i和j,它们的初值分别为区间的下界和上界,即i=low,i=high; 选取无序区的第一个记录R[i](即R[low])作为基准记录,并将它保存在变量pivot中;
第二步:
- 首先,令j自high起向左扫描,直到找到第1个关键字小于pivot.key的记录R[j],将R[j]移至i所指的位置上,这相当于R[j]和基准R[i](即pivot)进行了交换,使关键字小于基准关键字pivot.key的记录移到了基准的左边,交换后R[j]中相当于是pivot;
- 然后,令i指针自i+1 位置开始向右扫描,直至找到第1个关键字大于pivot.key的记录R[i],将R[i]移到i所指的 位置上,这相当于交换了R[i]和基准R[j],使关键字大于基准关键字的记录移到了基准的右边, 交换后R[i]中又相当于存放了pivot;
- 接着,令指针j自位置j-1开始向左扫描,如此交替改变扫 描方向,从两端各自往中间靠拢,直至i=j时,i便是基准pivot最终的位置,将pivot放在 此位置上就完成了一次划分。
快速排序示例过程,如下所示:
假设待排序数组为array = {94,12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49},数组大小为20。
首先,根据数组下界和上界,求得一个划分,划分过程如下:
- 第一次划分:
初始化:i = 0,j=19,以第一个元素array[0] = 94为基准pivot = array[0] = 94。
首先指针j向前移动:
array[19] = 49<pivot = array[0] = 94,i = 0<j = 19,继续移动j指针;
array[18] = 76<pivot = array[0] = 94,i = 0<j = 18,继续移动j指针;
……
array[1] = 12<pivot = array[0] = 94,i = 0<j = 1,继续移动j指针;
i = 0pivotPos-1 = -1排序停止;右侧部分继续递归执行快速排序。
- 第二次划分:
对于{12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49}:
初始化:i = 1,j=19,以第二个元素(除了第一次划分的基准元素)array[1] = 12为基准pivot = array[1] = 12。
首先指针j向前移动:
array[19] = 49>=pivot = array[1] = 12成立,并且j = 19>i = 1,j指针继续移动;
array[18] = 76>=pivot = array[1] = 12成立,并且j = 18>i = 1,j指针继续移动;
array[17] = 65>=pivot = array[1] = 12成立,并且j = 17>i = 1,j指针继续移动;
array[16] = 12>=pivot = array[1] = 12成立,并且j = 16>i = 1,j指针继续移动;
array[15] = 37>=pivot = array[1] = 12成立,并且j = 15>i = 1,j指针继续移动;
array[14] = 90>=pivot = array[1] = 12成立,并且j = 14>i = 1,j指针继续移动;
array[13] = 83>=pivot = array[1] = 12成立,并且j = 13>i = 1,j指针继续移动;
array[12] = 68>=pivot = array[1] = 12成立,并且j = 12>i = 1,j指针继续移动;
array[11] = 5>=pivot = array[1] = 12不成立,j指针停止移动:
此时i = 1<j = 11,将j指针处的元素移动到i指针处:array[1] = 5(基准元素的拷贝为pivot = 12),同时i指针向后移动一次:i++,即i = 2;
子数组变为(下面左边的12表示基准元素,实际j指针移动后并没有移动基准元素,而是pivot变量持有它的拷贝,12 处仍然是5):
{5,34,76,26,9,0,37,55,76,37,12,68,83,90,37,12,65,76,49}。
指针i向后移动:
array[2] = 34<=pivot = 12不成立,i指针停止移动:
此时i = 2<j = 11,将i指针处的元素移动到j指针处:array[11] = 34(基准元素的拷贝为pivot = 12),同时j指针向前移动一次:j–,即j = 10;
子数组变为:
{5,12,76,26,9,0,37,55,76,37,34,68,83,90,37,12,65,76,49}。
判断i与j:i = 2= pivot = 12成立,并且j = 10>i = 2,j指针继续移动;
array[9] = 76>= pivot = 12成立,并且j = 9>i = 2,j指针继续移动;
array[8] = 55>= pivot = 12成立,并且j = 8>i = 2,j指针继续移动;
array[7] = 37>= pivot = 12成立,并且j = 7>i = 2,j指针继续移动;
array[6] = 0>= pivot = 12不成立,j指针停止移动:
此时j = 6>i = 2,将j指针处的元素array[6] = 0移动到i指针处:array[2] = array[6] = 0(基准元素的拷贝为pivot = 12),同时i指针向后移动一次:i++,即i = 3;
子数组变为(下面左边的12表示基准元素,实际j指针移动后并没有移动基准元素,而是pivot变量持有它的拷贝,12处仍然是0):
{5,0,76,26,9,12,37,55,76,37,34,68,83,90,37,12,65,76,49}。
指针i第2次向后移动:
array[3] = 76i = 3,将i指针处的元素array[3] = 76移动到j指针处:array[6] = array[3] = 0(基准元素的拷贝为pivot = 12),同时j指针向前移动一次:j–,即j = 5;
子数组变为:
{5,0,12,26,9,76,37,55,76,37,34,68,83,90,37,12,65,76,49}。
判断i与j:i = 3=pivot = 12不成立,j指针停止移动:
此时j = 5>i = 3,将j指针处的元素array[5] = 9移动到i指针处:array[3] = array[5] = 9(基准元素的拷贝为pivot = 12),同时i指针向后移动一次:i++,即i = 4;
子数组变为(下面左边的12表示基准元素,实际j指针移动后并没有移动基准元素,而是pivot变量持有它的拷贝,12处仍然是9):
{5,0,9,26,12,76,37,55,76,37,34,68,83,90,37,12,65,76,49}。
指针i第3次向后移动:
array[4] = 26i = 4,将i指针处的元素array[4] = 26移动到j指针处:array[5] = array[4] = 26(基准元素的拷贝为pivot = 12),同时j指针向前移动一次:j–,即j = 4;
子数组变为:
{5,0,9,12,26,76,37,55,76,37,34,68,83,90,37,12,65,76,49}。
判断i与j:i = 4<j = 4不成立,条件不满足:
将基准元素放到i指针处,array[4] = pivot = 12;并返回基准元素的索引i = 4。
划分结束。
根据得到的基准元素的索引,递归快速排序。
算法分析
- 时间复杂度
最好情况
在最好情况下,每次划分所取的基准都是当前无序区的”中值”记录,划分的结果是基准的左、右两个无序子区间的长度大致相等,总的关键字比较次数:0(nlgn)。
最坏情况
最坏情况是每次划分选取的基准都是当前无序区中关键字最小(或最大)的记录,划分的结果是基准左边的子区间为空(或右边的子区间为空),而划分所得的另一个非空的子区间中记录数目,仅仅比划分前的无序区中记录个数减少一个。
因此,快速排序必须做n-1次划分,第i次划分开始时区间长度为n-i+1,所需的比较次数为n-i(1≤i≤n-1),故总的比较次数达到最大值:
n(n-1)/2 = O(n^2)
如果按上面给出的划分算法,每次取当前无序区的第1个记录为基准,那么当文件的记录已按递增序(或递减序)排列时,每次划分所取的基准就是当前无序区中关键字最小(或最大)的记录,则快速排序所需的比较次数反而最多。
- 空间复杂度
快速排序在系统内部需要一个栈来实现递归。若每次划分较为均匀,则其递归树的高度为O(logn),故递归后需栈空间为O(logn)。最坏情况下,递归树的高度为O(n),所需的栈空间为O(n)。
- 排序稳定性
快速排序是不稳定的。
本文基于署名-非商业性使用-相同方式共享 4.0许可协议发布,欢迎转载、使用、重新发布,但务必保留文章署名时延军(包含链接:http://shiyanjun.cn),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请与我联系。