快速排序
快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
步骤为:
- 从数列中挑出一个元素,称为"基准"(pivot),重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
- 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
- 递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会结束,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
快速排序的分析
如图所示,这是一个无序的列表,如何实现快速排序呢?
代码实现的思路
这段代码我觉得不难理解吧,第一个while循环是high游标向左移动,while循环的条件是low<high也就是两个游标不能重合,其次呢,是high游标指向的数值>mid_value,因为一旦high游标指向的数值小于mid_value就要交换位置了。一旦交换位置立马就轮到移动low的游标了,思路同high游标一样,high完成位置交换后,又轮到high了,开始轮回。 while实现多次轮回,>=是考虑到数值重合的问题
没包含等于情况的时候 左边的54会移到右边,右边的54会移到左边 为了实现54都在一边的情况,让alist[high]>=mid_value,就是让high游标指向的54不移动而是直接跳过,让左边的low游标指向54的时候再互换位置。
我们接着看代码,当low和high重合的时,如下图,55是刚从low那边移动过来,这是要开始移动high了,也就是重新开始新一轮轮回,high-=1,是不是直接就与high重合了,然后,low+=1是不是就low的游标前移了,high-=1,high的游标左移了,就不再满足大while的条件了,也无法控制mid_value。 这时就需要进行改进了: 将游标的加减纳入循环之中,避免了越界现象,重合后
只进行互换游标不再左右移动
。插入重合后的mid_value数值
此时,我们找到了中间值,并以中间值作为界限,划分成了两个子列,两个子列还要重复上述操作,进行快速排序。 分割到只有一个元素的时候就实现了 这时就用到了递归
这是课件上的快速排序图示
完整代码实现:
def quick_sort(li,start,end):
if start >= end:
return
low = start
high = end
mid_value = li[start]
while low < high:
#先从移动high游标开始
while li[high] >= mid_value and low < high:
high -= 1
li[low] = li[high]
#开始移动low游标
while li[low] < mid_value and low < high:
low += 1
li[high] = li[low]
#这个时候游标low和high均指向mid_value
li[low] = mid_value
quick_sort(li,start,low-1)
quick_sort(li,low+1,end)
if __name__ == '__main__':
ali = [12,23,11,33,4,55,12,44,52,21]
print(ali)
quick_sort(ali,0,len(ali)-1)
print(ali)
时间复杂度
最优时间复杂度:O(nlogn)
最坏时间复杂度:O(n^2)
稳定性:不稳定
从一开始快速排序平均需要花费O(n log n)时间的描述并不明显。但是不难观察到的是分区运算,数组的元素都会在每次循环中走访过一次,使用O(n)的时间。在使用结合(concatenation)的版本中,这项运算也是O(n)。
在最好的情况,每次我们运行一次分区,我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此,在到达大小为一的数列前,我们只要作log n次嵌套的调用。这个意思就是调用树的深度是O(log n)。但是在同一层次结构的两个程序调用中,不会处理到原来数列的相同部分;因此,程序调用的每一层次结构总共全部仅需要O(n)的时间(每个调用有某些共同的额外耗费,但是因为在每一层次结构仅仅只有O(n)个调用,这些被归纳在O(n)系数中)。结果是这个算法仅需使用O(n log n)时间。如果每次找到的中间都是开头第一个那就是最坏的时间复杂度了。
网友评论