排序算法说明 0 / 1 排序的定义
对一序列对象根据某个关键字进行排序
术语说明
稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面
不稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 可能会出现在 b 的后面
内排序:所有排序操作都在内存中完成
外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行
时间复杂度:一个算法执行所消耗的时间
空间复杂度:运行完一个程序所需要的内存的大小
算法比较
算法比较对比如图详细描述
冒泡排序 Bubble Sort
冒泡排序是一种简单的排序算法,它重复地走访要排序的数据,一次比较两个元素,如果它们的顺序错误就把他们交换多来,走访数列的工作使重复进行,直到没有再需要交换,也就是说该数列已经排序完成,这个算法的名字由来是因为越小的元素会经由交换谩骂你“浮”到数列的顶端。
算法描述
- 比较相邻的元素,如果第一个比第二个大,就交换它们两个
- 对每一对相邻的元素做同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数
- 针对所有元素重复以上的步骤,除了最后一个
- 重复以上步骤,直到!
动图演示
bubble sort.gif排序完成
代码实现
public int[] bubbleSort(int[] arr){
if(arr.length ==0){
return arr;
}
int temp;
for(int i = 0; i < arr.length; i++){
for(int j = 0; j < arr.length -1 - i; j++){
if(arr[j+1] < arr[j]){
swap(arr, j+1, j);
}
}
}
return arr;
}
后续代码中数据交换,使用下面的 swap() 函数
public void swap(int[] arr, int a, int b){
int temp = arr[a];
arr[a] = arr[b];
arr[b] = temp;
}
算法分析
时间复杂度 T(n) = O(n²)
选择排序 Selection Sort
表现最稳定的排序算法之一,因为无论什么数据进去都是O(n²)的时间复杂度,所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。理论上讲,选择排序可能是平时排序一般人想到的最多的排序方法了吧
选择排序 selection-sort 是一种简单直观的排序算法, 它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾,以此类推,直到所有元素均排序完毕
算法描述
n 个记录的直接选择排序可经过 n-1 趟直接选择排序得到结果。
具体算法描述如下:
- 初始状态:无序区 R[1..n],有序区为空;
- 第 i 趟排序(i=1,2,3...n-1)开始时,当前有序区和无序区分别为 R[1...i-1] 和 R[i...n]。该趟排序从当前无序区中选出关键字最小的记录R[k],将它与无序区的第1个记录交换,使 R[1...i] 和 R[i+1...n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区;
- n-1趟结束,数组有序化了
动图演示
selection sort.gif代码实现
public int[] selectionSort(int[] arr){
if(arr.length==0){
return arr;
}
int minIndex;
int temp;
for(int i = 0; i < arr.length; i++){
minIndex = i;
for(int j = i; j < arr.length; j++){
// 找到最小的数,将其索引保存
if(arr[j] < arr[minIndex]){
minIndex = j;
}
}
swap(arr, i, minIndex);
}
}
算法分析
复杂度
- 最佳 T(n) = O(n²)
- 最差 T(n) = O(n²)
- 平均 T(n) = O(n²)
直接插入排序 Insertion Sort
插入排序是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应的位置并插入。插入排序在实现上,通常采用 in-place 排序(即只需用到 O(1) 的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,未最新元素提供插入空间
算法描述
- 从第一个元素开始,该元素可以认为已经被排序
- 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 如果该元素(已排序)大于新元素,将该元素移到下一个位置
- 重复步骤3.直到找到已排序的元素小于或等于新元素的位置
- 将新元素插入到该位置后
- 重复步骤 2~5
动图演示
insertion sort.gif代码实现
public int[] insertionSort(int[] arr){
if(arr.length == 0){
return arr;
}
int current;
int preIndex;
for(int i = 0; i < arr.length - 1; i++){
current = arr[i+1];
preIndex = i;
while(preIndex >= 0 && current < arr[preIndex]){
arr[preIndex + 1] = arr[preIndex];
preIndex--;
}
arr[preIndex + 1] = current;
}
}
算法分析
复杂度
- 最佳 T(n) = O(n)
- 最差 T(n) = O(n²)
- 平均 T(n) = O(n²)
希尔排序 Shell Sort
希尔排序是 Donald Shell 于1959年提出的一种排序算法,希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也成为缩小增量排序,同时该算法也是冲破 O(n²) 的第一批算法之一。它与插入排序的不同之处在于,它会优先比较距离较远的元素。
希尔排序是把记录按下表的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关系键词越来越多,当增量减至1时,整个文件恰被分为一组,算法便终止
算法描述
在此我们选择增量 gap = length / 2
,缩小增量继续以 gap = gap / 2
的方式,这种增量选择我们可以用一个序列来表示,{n/2, (n/2)/2, ..., 1} 成为增量序列。
希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,成为希尔增量,但其实这个增量序列不是最优的。
先将这个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:
- 选择一个增量序列 t1, t2, t3, ... ,tk 其中ti>tj,tk = 1;
- 按增量序列个数 k,对序列进行 k 趟排序
- 每趟排序,根据对应的增量ti,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序,仅增量因子为1时,整个序列作为一个表来处理,表长度即为整个序列的长度。
过程演示
shell sort.jpg代码实现
public int[] shellSort(int[] arr){
if(arr.length == 0){
return arr;
}
int temp;
int gap = arr.length / 2;
while(gap > 0){
// 插入排序
for(int i = gap; i < arr.length; i++){
temp = arr[i];
int preIndex = i -gap;
while(preIndex >= 0 && arr[preIndex] > temp){
arr[preIndex + gap] = arr[preIndex];
preIndex -= gap;
}
arr[preIndex + gap] = temp;
}
// 增量递减
gap /= 2;
}
return arr;
}
算法分析
复杂度
- 最佳 T(n) =
- 最差 T(n) =
- 平均 T(n) =
归并排序 Merge Sort
和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好得多,因为始终都是 O(n log n) 的时间复杂度。代价是需要额外的内存空间。
归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为2-路归并
算法描述
- 将长度为 n 的输入序列分成两个长度为 n/2的子序列
- 对这两个子序列分别采用归并排序
- 将两个排序好的子序列合并成一个最终的排序序列
动图演示
merge sort.gif代码实现
public int[] mergeSort(int[] arr){
if(arr.length <= 1){
return arr;
}
int mid = arr.length / 2;
int[] left = Arrays.copyOfRange(arr, 0, mid);
int[] right = Arrays.copyOfRange(arr, mid, arr.length);
return merge(mergeSort(left), mergeSort(right));
}
public int[] merge(int[] left, int[] right){
int[] result = new int[left.length + right.length];
for(int index = 0, i = 0, j = 0; index < result.length; index ++){
if(i >= left.length)
result[index] = right[j++];
else if(j >= right.length)
result[index] = left[i++];
else if(left[i] > right[j])
result[index] = right[j++];
else
result[index] = left[i++];
}
return result;
}
算法分析
复杂度
- 最佳 T(n) = O(n)
- 最差 T(n) = O(n ㏒n)
- 平均 T(n) = O(n ㏒n)
快速排序 Quick Sort
快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录进行排序,以达到整个序列有序
算法描述
快速排序使用分治法来把一个串 list 分为两个子串 sub-list。具体算法描述如下:
- 从数列中挑出一个元素,称为基准 pivot
- 重新排序序列,所有元素比基准小的摆放在基准前面,所有元素比基准大的摆在基准后面(相同的数可以放任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区操作 partition
- 递归 recursive 把小于基准值元素的子数列和大于基准值的子数列排序
动图演示
quick sort.gif代码实现
public int[] quickSort(int[] arr, int start, int end){
if(arr.length < 1 || start < 0 || end >= arr.length || start > end){
return arr;
}
int smallIndex = partition(arr, start, end);
if(smallIndex > start)
quickSort(arr, start, smallIndex - 1);
if(smallIndex < end)
quickSort(arr, smallIndex + 1, end);
}
public int partition(int[] arr, int start, int end){
int pivot = (int)(start + Math.random * (end -start + 1));
int smallIndex = start - 1;
swap(arr, pivot, end);
for(int i = start; i <= end; i++){
if(arr[i] < arr[end]){
smallIndex++;
if(i > smallIndex)
swap(arr, i, smallIndex)
}
}
}
算法分析
复杂度
- 最佳 T(n) = O(n ㏒n)
- 最差 T(n) = O(n²)
- 平均 T(n) = O(n ㏒n)
快速排序2
上面的代码没有太明白
- 设置两个指针 low 和 high 分别指向待排序的开始和结尾
- 记录下基准值 baseval (待排序列的第一个记录)
- 然后先从 high 所指的位置向前搜索知道找到一个小于 baseval 的记录,并互相交换,接着从 low 所指向的位置向后搜索直到找到一个大于 baseval 的记录。并相互交换,重复这两个步骤
为什么一定要high指针先动呢?首先这也不是绝对的,这取决于基准数的位置,因为在最后两个指针相遇的时候,要交换基准数到相遇的位置。一般选取第一个数作为基准数,那么就是在左边,所以最后相遇的数要和基准数交换,那么相遇的数一定要比基准数小。所以j指针先移动才能先找到比基准数小的数。
quick sort2.gifpublic int[] quickSort(int[] arr, int low, int high){
if(arr.length == 0){
return arr;
}
if(low >= high){
return arr;
}
// 取待排序列第一个记录作为基准数
int baseval = arr[start];
int first = start;
int last = end;
while(first < last){
while(first < last && a[last] >= baseval){
--last;
}
// 将比基准值小的移到低端
a[first] = a[last];
while(first < last && a[first] <= key){
++first;
}
// 将比基准值大的移到高端
a[last] = a[first];
}
// 将基准值归位
a[first] = baseval;
quickSort(arr, low, first - 1);
quickSort(arr, first + 1, high);
}
堆排序 Heap Sort
堆排序是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆的性质,即子结点的键值或索引总是小于(大于)它的父节点。
算法描述
- 将初始待排序关键字序列(R1,R2,...,Rn)构建成大顶堆,此堆为初始的无序区
- 将堆顶元素 R[1] 与最后一个元素 R[n] 交换,此时得到新的无序区(R1,R2,...,Rn-1)和新的有序区(Rn),且满足 R[1,2,...,n-1]<=R[n]
- 由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,...,Rn-1)调整为新堆,然后再次将 R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2,...,Rn-2)和新的有序区(Rn-1,Rn)
- 不断重复此过程知道有序区的元素个数为 n-1,则整个排序过程完成
动图演示
heap sort.gif代码实现
public int[] heapSort(int[] arr){
if(arr.length == 0){
return arr;
}
// 1. 构建一个最大堆
buildMaxHeap(arr);
// 2. 循环将堆首位与末位交换,然后重新调成最大堆
int len = arr.length;
while(len > 0){
swap(arr,0,len - 1);
len--;
adjustHeap(arr, 0);
}
return arr;
}
public void buildMaxHeap(){
for(int i = (len - 1)/2; i >=0; i--){
adjustHeap(arr, i);
}
}
public void adjustHeap(int[] arr, int i){
int maxIndex = i;
// 如果有左子树,且左子树大于父节点,则将最大指针指向左子树
if(i * 2 < len && arr[i * 2] > arr[maxIndex])
maxIndex = i * 2;
// 如果有右子树,且右子树大于父节点,则将最大指针指向右子树
if(i * 2 + 1 < len && arr[i * 2 + 1] > arr[maxIndex])
maxIndex = i * 2 + 1;
// 如果父节点不是最大值,则将父节点与最大值交换,并且递归调整与父节点交换的位置
if(maxIndex != i){
swap(arr, maxIndex, i);
adjustHeap(arr, maxIndex);
}
}
算法分析
复杂度
- 最佳 T(n) = O(n ㏒n)
- 最差 T(n) = O(n ㏒n)
- 平均 T(n) = O(n ㏒n)
计数排序 Counting Sort
桶排序 Bucket Sort
基数排序 Radix Sort
参考资料
感谢以下文章作者
十大经典排序算法最强总结
面试中的排序算法总结
八大排序算法总结
网友评论