十大经典排序算法(Java)


排序算法说明

1. 排序的定义

对一序列对象根据某个关键字进行排序。本文对十大排序算法进行解读。

2. 术语说明

  • 稳定:如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面;
  • 不稳定:如果 a 原本在 b 的前面,而 a=b,排序之后 a 可能会出现在 b 的后面;
  • 内排序:所有排序操作都在内存中完成;
  • 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
  • 时间复杂度: 一个算法执行所耗费的时间。
  • 空间复杂度:运行完一个程序所需内存的大小。

3. 算法总结

图片名词解释:

  • n: 数据规模
  • k: “桶” 的个数
  • In-place: 占用常数内存,不占用额外内存
  • Out-place: 占用额外内存

4. 算法分类

5. 比较和非比较的区别

常见的快速排序、归并排序、堆排序、冒泡排序等属于比较排序在排序的最终结果里,元素之间的次序依赖于它们之间的比较。每个数都必须和其他数进行比较,才能确定自己的位置。
冒泡排序之类的排序中,问题规模为 n,又因为需要比较 n 次,所以平均时间复杂度为 O(n²)。在归并排序、快速排序之类的排序中,问题规模通过分治法消减为 logN 次,所以时间复杂度平均 O(nlogn)
比较排序的优势是,适用于各种规模的数据,也不在乎数据的分布,都能进行排序。可以说,比较排序适用于一切需要排序的情况。

计数排序、基数排序、桶排序则属于非比较排序。非比较排序是通过确定每个元素之前,应该有多少个元素来排序。针对数组 arr,计算 arr[i] 之前有多少个元素,则唯一确定了 arr[i] 在排序后数组中的位置。
非比较排序只要确定每个元素之前的已有的元素个数即可,所有一次遍历即可解决。算法时间复杂度 O(n)
非比较排序时间复杂度底,但由于非比较排序需要占用空间来确定唯一位置。所以对数据规模和数据分布有一定的要求。


1.冒泡排序(Bubble Sort)

冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢 “浮” 到数列的顶端。

1.1 算法描述

  • 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
  • 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
  • 针对所有的元素重复以上的步骤,除了最后一个;
  • 重复步骤 1~3,直到排序完成。

1.2 动图演示

1.3 代码实现

易错点:注意内层循环还是从0开始的

/**
 * 比较相邻两个元素,每轮循环将最大值冒泡出来。最右侧是有序区
 */
public static void bubbleSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int len = array.length;
    for (int i = 0; i < len; i++) {
        // 最右侧是有序区,因此内循环的范围是0到有序区
        // 易错点:注意内层循环还是从0开始的
        for (int j = 0; j < len - 1 - i; j++) {
            if (array[j] > array[j + 1]) {
                int temp = array[j + 1];
                array[j + 1] = array[j];
                array[j] = temp;
            }
        }
    }
    System.out.println("冒泡排序: " + Arrays.toString(array));
}

1.4 算法分析

冒泡排序是稳定的排序算法,最容易实现的排序。

由于冒泡排序中只有缓存的temp变量需要内存空间, 因此空间复杂度为常量O(1)

最坏的情况是每次都需要交换, 共需遍历并交换将近n²/2次, 时间复杂度为O(n²)

最佳的情况是内循环遍历一次后发现排序是对的, 因此退出循环, 时间复杂度为O(n)

平均来讲, 时间复杂度为O(n²)

2.选择排序(Selection Sort)

无论什么数据进去都是 O(n²) 的时间复杂度,所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间。理论上讲,选择排序可能也是平时排序一般人想到的最多的排序方法了吧。

选择排序 (Selection-sort) 是一种简单直观的排序算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

2.1 算法描述

n 个记录的直接选择排序可经过 n-1 趟直接选择排序得到有序结果。具体算法描述如下:

  • 初始状态:无序区为 R[1..n],有序区为空;
  • 第 i 趟排序 (i=1,2,3…n-1) 开始时,当前有序区和无序区分别为 R[1..i-1]和 R(i..n)。该趟排序从当前无序区中 - 选出关键字最小的记录 R[k],将它与无序区的第 1 个记录 R 交换,使 R[1..i]和 R[i+1..n)分别变为记录个数增加 1 个的新有序区和记录个数减少 1 个的新无序区;
  • n-1 趟结束,数组有序化了。

2.2 动图演示

  

2.3 代码实现

易错点:最值要在循环内定义,因为这是未排序部分的最值,而不是整个数组的最值。

/**
 * n轮循环,每轮循环找到未排序区域的最小值,放到左侧有序区域。最终全部为有序。
 */
public static void selectSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int len = array.length;
    // 每一轮循环找到一个最小值,在未排序元素中
    for (int i = 0; i < len; i++) {
        // 记录最小值下标
        // 易错点:最值要在循环内定义,因为这是未排序部分的最值,而不是整个数组的最值。
        int index = i;
        // 左侧为有序区。内循环从当前的下一个(i + 1)开始
        for (int j = i + 1; j < len; j++) {
            if (array[j] < array[index]) {
                index = j;
            }
        }
        if (index != i) {
            int temp = array[index];
            array[index] = array[i];
            array[i] = temp;
        }
    }
    System.out.println("选择排序: " + Arrays.toString(array));
}

2.4 算法分析

最佳情况:O(n²) 最差情况:O(n²) 平均情况: O(n²)

3.插入排序(Insertion Sort)

插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用 in-place 排序(即只需用到 O(1) 的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。

3.1 算法描述

一般来说,插入排序都采用 in-place 在数组上实现。具体算法描述如下:

  • 从第一个元素开始,该元素可以认为已经被排序;
  • 取出下一个元素,在已经排序的元素序列中从后向前扫描;
  • 如果该元素(已排序)大于新元素,将该元素移到下一位置;
  • 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
  • 将新元素插入到该位置后;
  • 重复步骤 2~5。

3.2 动图演示

3.3 代码实现

提供两种写法,一种是移位法,一种是交换法。移位法是完全按照以上算法描述实,再插入过程中将有序序列中比待插入数字大的数据向后移动,由于移动时会覆盖待插入数据,所以需要额外的临时变量保存待插入数据,代码实现如下:

/**
 * 插入排序-移位法
 * 每次在右侧未排序队列,选中一个元素,在左侧有序队列中,找适合自己的位置,并插入
 */
public static void insertionSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    for (int i = 0; i < array.length; i++) {
        int j = i - 1;
        // cur即被选中,进行操作的元素
        int cur = array[i];

        // 如果比待插入数据大,就后移
        while (j >= 0 && cur < array[j]) {
            // j位置元素大,后移,腾出位置
            array[j + 1] = array[j];
            // 一直向前,直到找到合适的位置
            j--;
        }
        // 找到比待插入数据小的位置,将待插入数据插入
        // 为什么要+1?因为最后一次循环会将j变成-1,多做了一次减法,所以要加回来
        array[j + 1] = cur;
    }
    System.out.println("插入排序: " + Arrays.toString(array));
}

而交换法不需求额外的保存待插入数据,通过不停的向前交换带插入数据,类似冒泡法,直到找到比它小的值,也就是待插入数据找到了自己的位置:

public static void insertionSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    for (int i = 1; i < array.length; i++) {
        int j = i - 1;
        while (j >= 0 && array[j] > array[i]) {
            // 只要大就交换操作
            // 这里采用一种不需要额外空间的交换方法,但是加法存在溢出的风险。
            // 将要交换的两数累加
            array[j + 1] = array[j] + array[j+1];   
            // 第一个位置 = 和 - 原来的值 = 第二个位置的值
            array[j] = array[j + 1] - array[j];
            // 第二个位置 = 和 - 第一个位置的值 = 第一个位置原来的值
            array[j + 1] = array[j + 1] - array[j];
        }

        // 插入排序的另一种写法
        // int j;
        // for (int j = i; j >= gap && array[j - gap] > temp; j -= gap) {
        //     array[j] = array[j - gap];
        // }
        // array[j] = temp;
    }
    System.out.println("插入排序: " + Arrays.toString(array));
}

3.4 算法分析

最佳情况: O(n) 最坏情况: O(n²) 平均情况: O(n²) 空间复杂度:O(1)

4.希尔排序(Shell Sort)

希尔排序是希尔(Donald Shell)于 1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序,同时该算法是冲破 O(n2)的第一批算法之一。它与插入排序的不同之处在于,它会优先比较距离较远的元素; 直接插入排序是稳定的;而希尔排序是不稳定的。希尔排序又叫缩小增量排序。

希尔排序是把记录按一定增量分组(gap 间隔),对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个文件恰被分成一组,算法便终止。

4.1 算法描述

我们来看下希尔排序的基本步骤,在此我们选择增量 gap=length/2,缩小增量继续以 gap = gap/2 的方式,这种增量选择我们可以用一个序列来表示,{n/2,(n/2)/2…1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。

先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

  • 选择一个增量序列 t1,t2,…,tk,其中 ti>tj,tk=1;
  • 按增量序列个数 k,对序列进行 k 趟排序;
  • 每趟排序,根据对应的增量 ti,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

4.2 过程演示

4.3 代码实现

/**
 * 希尔排序,关键是gap 就是间隔进行分组,然后组内进行插入排序
 * 是插入排序的改良版,区别在于插入排序的preIndex = i - 1,也就是说间隔是1
 * 改进的地方在于:如果最后一位是最小值,要找到合适的位置,需要和前面的n-1个数字依次比较。如果用希尔排序
 * 间隔大,移动次数小。间隔小,移动距离短。
 * 缺点:不稳定
 * [8,9,1,7,2,3,5,4,6,0]
 */
public static void ShellSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int len = array.length;
    int temp;
    for (int gap = len / 2; gap > 0; gap /= 2) {
        // 插入排序。
        for (int i = gap; i < len; i++) {
            // 右侧分组第一个数,即中位数gap右边元素
            temp = array[i];
            // 左侧分组第一个数 = i与中位数gap的差 = i自增的次数 = 左侧下标
            // 固定距离的双指针,i和j的距离始终是gap,在循环中同步增长            
            int j = i - gap;
            while (j >= 0 && array[j] > temp) {
                array[j + gap] = array[j];
                j -= gap;
            }
            array[j + gap] = temp;
        }
    }
    System.out.println("希尔排序: " + Arrays.toString(array));
}

// 第二种写法:
public static void ShellSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int len = array.length;
    int gap = array.length / 2;
    // 不断缩小gap,直到1为止
    while (gap > 0) {
        // j用来控制分组内多个元素时,比较的次数
        for (int j = 0; (j + gap) < len; j++) {
            // k左侧元素,k+gap=右侧元素。依次调整每个分组
            for (int k = 0; (k + gap) < len; k++) {
                if (arr[k] > array[k + gap]) {
                    // 交换操作
                    array[k] = array[k] + array[k + gap];
                    array[k + gap] = array[k] - array[k + gap];
                    array[k] = array[k] - array[k + gap];
                }
            }
        }
        gap /= 2;
    }
    System.out.println("希尔排序: " + Arrays.toString(array));
}

4.4 算法分析

*最佳情况: O(nlog n) 最坏情况: O(nlog n) 平均情况:O(nlog n) *

5.归并排序(Merge Sort)

和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 O(n log n)的时间复杂度。代价是需要额外的内存空间。

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为 2 - 路归并。

5.1 算法描述

  • 把长度为 n 的输入序列分成两个长度为 n/2 的子序列;
  • 对这两个子序列分别采用归并排序;
  • 将两个排序好的子序列合并成一个最终的排序序列。

5.2 动图演示

5.3 代码实现

  1. 申请空间用来存放合并后的序列,大小为两个已排序序列之和
  2. 设定两个指针 ,初始位置分别为两个已排序序列的起始位置
  3. 比较两个指针指向的元素,选择相对小的元素放入结果空间,并移动指针到下一个位置
  4. 重复步骤 3直到某一指针到达序列尾部
  5. 将另一序列剩下的所有元素直接合并到序列尾部
public static void sort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int[] result = MergeSort(array);
    System.out.println("归并排序: " + Arrays.toString(result));
}

/**
 * 归并排序
 * 先分治,在合并
 */
public static int[] MergeSort(int[] array) {
    // >> 1 等价于 /2
    int mid = array.length >> 1;
    int[] left = Arrays.copyOfRange(array, 0, mid);
    int[] right = Arrays.copyOfRange(array, mid, array.length);
    return merge(MergeSort(left), MergeSort(right));
}

/**
 * 将两段排序好的数组结合成一个排序数组
 */
public static int[] merge(int[] left, int[] right) {
    int[] result = new int[left.length + right.length];
    int i = 0, j = 0, k = 0;
    while (i < left.length && j < right.length) {
        if (left[i] <= right[j]) {
            result[k++] = left[i++];
        }else {
            result[k++] = right[j++];
        }
    }
    // left中的剩余元素移入结果数组
    while (i < left.length) {
        result[k++] = left[i++];
    }
    // right中的剩余元素移入结果数组
    while (j < right.length) {
        result[k++] = right[j++];
    }
    return result;
}

5.4 算法分析

最佳情况:O(nlog n) 最差情况:O(nlog n) 平均情况: O(nlog n) 空间复杂度:O(n)

6.快速排序(Quick Sort)

快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行快速排序,以达到整个序列有序。

6.1 算法描述

快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:

  • 从数列中挑出一个元素,称为 “基准”(pivot);
  • 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
  • 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

6.2 动图演示

交换法

6.3 代码实现

public static void Sort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    int[] copyArray = Arrays.copyOf(array, array.length);
    QuickSort(array, 0, array.length - 1);
    System.out.println("快速排序-递归: " + Arrays.toString(array));

    QuickSortIterate(copyArray, 0, array.length - 1);
    System.out.println("快速排序-非递归: " + Arrays.toString(copyArray));
}

public static void QuickSort(int[] array, int left, int right) {
    if (left < right) {
        // 每次递归确定一个元素的位置,这个元素在整个序列中已经是固定的。
        int partitionIndex = swapPartition(array, left, right);
        // 左右子序列各自递归排序
        QuickSort(array, left, partitionIndex - 1);
        QuickSort(array, partitionIndex + 1, right);
    }
}

/**
 * 交换法:
 * 1.右指针移动到比key小的元素位置,左指针移动到比key大的元素位置;
 * 2.交换左右指针位置的元素;
 * 3.重复,直到左右指针相遇,交换相遇位置元素和key,返回相遇位置下标(key在整个序列中应该在的位置)
 * 注意,右指针先移动,找到目标后停下来让左指针开始工作
 */
public static int swapPartition(int[] array, int left, int right) {
    int key = left;
    // 循环结束的条件:左右指针相遇
    while (left < right) {
        // 目的是让右侧都大于key,所以 要找到比key小的
        while (left < right && array[right] >= array[key]) {
            // 如果不小于key则向左移动指针
            right--;
        }
        // 目的是让左侧都小于key,所以要找到比key大的
        while (left < right && array[left] <= array[key]) {
            // 如果不大于key则向右移动指针
            left++;
        }
        // 交换遇到的元素,让应该在左边但是在右边的回到左边去,右边同理
        swap(array, array[left], array[right]);
    }
    // 左右指针相遇,交换key和相遇位置元素,key的位置确定
    swap(array, array[key], array[left]);
    // 返回相遇位置下标(key在整个序列中应该在的位置)
    return left;
}

/**
 * 挖坑法
 * 单趟排序的思路是:取最左或最右边的元素为key,假设把这个位置“挖空”,让最右边的向左走,直到遇到比key小的数,将其放到key的位置,自己的位置变“空”。
 * 每一次指针停下来时,只需要将当前位置元素与空位置交换。
 * 直到pq相遇,那么这个位置就是最终的坑位,再将key填入这个坑位,就完成了一趟排序。
 */
public static int waKengPartition(int[] array, int left, int right) {
    int key = left;
    int value = array[key];
    while (left < right) {
        while (left < right && array[right] >= value) {
            right--;
        }
        // 将right位置元素放到key位置,right位置置空。
        array[key] = array[right];
        key = right;
        while (left < right && array[left] <= value) {
            left++;
        }
        // 将left位置元素放到key位置,left位置置空。
        array[key] = array[left];
        key = left;
    }
    array[key] = value;
    return key;
}

/**
 * 交换数组内两个元素
 */
public static void swap(int[] array, int i, int j) {
    int temp = array[i];
    array[i] = array[j];
    array[j] = temp;
}


/**
 * 快速排序-非递归
 */
public static void QuickSortIterate(int[] array, int left, int right) {
    LinkedList<Integer> stack = new LinkedList();
    stack.push(left);
    stack.push(right);
    while (!stack.isEmpty()) {
        right = stack.pop();
        left = stack.pop();
        // 对区间进行一趟排序,取得key值
        int key = swapPartition(array, left, right);
        // 如果左区间可以再分,就入栈
        if (left < key - 1) {
            stack.push(left);
            stack.push(key - 1);
        }
        // 如果右区间可以再分,就入栈
        if (right > key + 1) {
            stack.push(key + 1);
            stack.push(right);
        }
    }
}

TODO

  • 快慢指针法

  • 非递归实现

  • 如何优化?

    • key的选择:三数取中

      面对完全有序的数组,快速排序每趟排序后,key的位置都在边缘,每层递归都只能固定一个数,时间复杂度变成了O(N^2)。

      面对这种情况,我们可以在取key时动手脚。每次取key我们不再只取最左或最右的值。而是对比最左、最右、中间的三个元素,取三个元素中,值在另外两者中间的元素作为key。这样,就打乱了有序数组,大大加快了快速排序在面对这种情况时的速度。

    • 小区间优化

      快速排序对一个元素不多的数组排序,仍需要进行多次递归调用,我们知道递归是比较消耗资源的,所以为了避免在快速排序递归的最后几层大量调用函数,我们可以在数组元素较少时不再递归,而是采用选择排序替代,这样就能在不损失多少速度的情况下减少大量的递归次数,达到优化速度的目的。

6.4 算法分析

最佳情况: O(nlog n) 最差情况: O(n²) 平均情况: O(nlog n) 空间复杂度:O(1)

7.堆排序(Heap Sort)

堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。

7.1 算法描述

  • 将初始待排序关键字序列 (R1,R2….Rn) 构建成大顶堆,此堆为初始的无序区;(一般升序采用大顶堆,降序采用小顶堆);
  • 将堆顶元素 R[1]与最后一个元素 R[n]交换,此时得到新的无序区 (R1,R2,……Rn-1) 和新的有序区(Rn,), 且满足 R[1,2…n-1]<=R[n];
  • 恢复堆。由于交换后新的堆顶 R[1]可能违反堆的性质,因此需要对当前无序区 (R1,R2,……Rn-1) 调整为新堆,然后再次将 R[1]与无序区最后一个元素交换,得到新的无序区 (R1,R2….Rn-2) 和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为 n-1,则整个排序过程完成。

7.2 动图演示

7.3 代码实现

注意:这里用到了完全二叉树的部分性质:详情见《数据结构二叉树知识点总结》

/**
 * 堆排序
 * 构建大顶堆,交换堆顶元素与末尾元素,恢复大顶堆
 * 每次将最大值“沉”到数组末端,升序
 */
public static void heapSort(int[] array) {
    int len = array.length;
    // 1.构建大顶堆
    // 从最后一个非叶子节点开始
    for (int i = len / 2 - 1; i >= 0; i--) {
        // 第一个非叶子节点i,从下至上、从左至右调整结构
        adjustHeap(array, i, len);
    }
    // 2.交换堆顶与末尾 + 调整堆结构
    // j就是末尾元素
    for (int j = len - 1; j > 0; j--) {
        // swap方法,交换操作
        swap(array, i, j);
        // adjustHeap方法,重新调整堆结构
        adjustHeap(array, i, j);
    }
}

/**
 * 调整大顶堆(仅是调整过程,建立在大顶堆已构建的基础上)
 */
public static void adjustHeap(int[] array, int i, int length) {
    // 以i节点为父节点,先将值放到temp保存
    int temp = array[i];
    // 从i节点的左子节点开始,找出最大值,放到父节点位置
    for (int k = i*2+1; k < length; k = k*2+1) {
        // 如果左子节点小于右子节点,k指向右子节点
        if (k+1 < length && array[k] < array[k + 1]) {
            k++;
        }
        // 如果子节点大于父节点,将子节点值赋给父节点,最终使i为最大值
        // 注意,这里k覆盖了i位置元素
        if (array[k] > temp) {
            array[i] = array[k];
            i = k;
        }else {
            break;
        }
    }
    // 此时才真正确定i的位置,将保存的值还给i
    array[i] = temp;
}

/**
 * 交换元素
 */
public static void swap(int[] array, int a, int b) {
    int temp = array[a];
    array[a] = array[b];
    array[b] = temp;
}

7.4 算法分析

由于堆排序中初始化堆的过程比较次数较多, 因此它不太适用于小序列。同时由于多次任意下标相互交换位置, 相同元素之间原本相对的顺序被破坏了, 因此, 它是不稳定的排序。

最佳情况: O(nlogn) 最差情况: O(nlogn) 平均情况: O(nlogn) 空间复杂度:O(1)

8.计数排序(Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

计数排序 (Counting sort) 是一种稳定的排序算法。计数排序使用一个额外的数组 C,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。它只能对整数进行排序。

8.1 算法描述

  • 找出待排序的数组中最大和最小的元素;
  • 统计数组中每个值为 i 的元素出现的次数,存入数组 C 的第 i 项;
  • 对所有的计数累加(从 C 中的第一个元素开始,每一项和前一项相加);
  • 反向填充目标数组:将每个元素 i 放在新数组的第 C(i) 项,每放一个元素就将 C(i) 减去 1。

8.2 动图演示

8.3 代码实现

/**
 * 计数排序
 */
public static int[] CountingSort(int[] array) {
    int bias;
    int min = array[0];
    int max = array[0];
    for (int i = 1; i < array.length; i++) {
        if (array[i] > max)
            max = array[i];
        if (array[i] < min)
            min = array[i];
    }
    bias = 0 - min;
    int[] bucket = new int[max - min + 1];
    Arrays.fill(bucket, 0);
    for (int i = 0; i < array.length; i++) {
        bucket[array[i] + bias]++;
    }
    int index = 0;
    int i = 0;
    while (index < array.length) {
        if (bucket[i] != 0) {
            array[index] = i - bias;
            bucket[i]--;
            index++;
        } else {
            i++;    
        }
    }
    System.out.println("计数排序: " + Arrays.toString(array));
}

8.4 算法分析

当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 O(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上 1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。

最佳情况: O(n+k) 最差情况: O(n+k) 平均情况: O(n+k)

9.桶排序(Bucket Sort)

桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。

桶排序 (Bucket sort) 的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排

9.1 算法描述

  • 人为设置一个 BucketSize,作为每个桶所能放置多少个不同数值(例如当 BucketSize==5 时,该桶可以存放{1,2,3,4,5}这几种数字,但是容量不限,即可以存放 100 个 3);
  • 遍历输入数据,并且把数据一个一个放到对应的桶里去;
  • 对每个不是空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
  • 从不是空的桶里把排好序的数据拼接起来。

注意,如果递归使用桶排序为各个桶排序,则当桶数量为 1 时要手动减小 BucketSize 增加下一循环桶的数量,否则会陷入死循环,导致内存溢出。

9.2 图片演示

9.3 代码实现

/**
 * 桶排序
 */
public static void BucketSort(ArrayList<Integer> array, int bucketSize) {
    if (array == null || array.length < 2) {
        return;
    }
    int max = array.get(0), min = array.get(0);
    // 找到最大值最小值
    for (int i = 0; i < array.size(); i++) {
        if (array.get(i) > max)
            max = array.get(i);
        if (array.get(i) < min)
            min = array.get(i);
    }
    int bucketCount = (max - min) / bucketSize + 1;
    ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketCount);
    ArrayList<Integer> resultArr = new ArrayList<>();
    for (int i = 0; i < bucketCount; i++) {
        bucketArr.add(new ArrayList<Integer>());
    }
    for (int i = 0; i < array.size(); i++) {
        bucketArr.get((array.get(i) - min) / bucketSize).add(array.get(i));
    }
    for (int i = 0; i < bucketCount; i++) {
        if (bucketSize == 1) { // 如果带排序数组中有重复数字时  感谢 @见风任然是风 朋友指出错误
            for (int j = 0; j < bucketArr.get(i).size(); j++)
                resultArr.add(bucketArr.get(i).get(j));
        } else {
            if (bucketCount == 1)
                bucketSize--;
            ArrayList<Integer> temp = BucketSort(bucketArr.get(i), bucketSize);
            for (int j = 0; j < temp.size(); j++)
                resultArr.add(temp.get(j));
        }
    }
    System.out.println("桶排序: " + Arrays.toString(resultArr));
}

9.4 算法分析

桶排序最好情况下使用线性时间 O(n),桶排序的时间复杂度,取决与对各个桶之间数据进行排序的时间复杂度,因为其它部分的时间复杂度都为 O(n)。很显然,桶划分的越小,各个桶之间的数据越少,排序所用的时间也会越少。但相应的空间消耗就会增大。

*最佳情况: O(n+k) 最差情况: O(n+k) 平均情况: O(n^2)  *

10.基数排序(Radix Sort)

将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后,数列就变成一个有序序列。

基数排序按照优先从高位或低位来排序有两种实现方案:

MSD(Most significant digital) 从最左侧高位开始进行排序。先按k1排序分组, 同一组中记录, 关键码k1相等, 再对各组按k2排序分成子组, 之后, 对后面的关键码继续这样的排序分组, 直到按最次位关键码kd对各子组排序后. 再将各组连接起来, 便得到一个有序序列。MSD方式适用于位数多的序列

LSD(Least significant digital) 从最右侧低位开始进行排序。先从kd开始排序,再对kd-1进行排序,依次重复,直到对k1排序后便得到一个有序序列。LSD方式适用于位数少的序列

基数排序基于分别排序,分别收集,不改变相同元素之间的相对顺序,所以是稳定的。

下面以LSD为例。

10.1 算法描述

  • 取得数组中的最大数,并取得位数;
  • arr 为原始数组,从最低位开始取每个位组成 radix 数组;
  • 对 radix 进行计数排序(利用计数排序适用于小范围数的特点);

10.2 动图演示

10.3 代码实现

/**
 * 基数排序
 * @param array
 * @return
 */
public static void RadixSort(int[] array) {
    if (array == null || array.length < 2) {
        return;
    }
    // 1.先算出最大数的位数;
    int max = array[0];
    for (int i = 1; i < array.length; i++) {
        if (a[i] > max) {
            max = a[i];
        }
    }
    int maxDigit = 0;
    while (max != 0) {
        max /= 10;
        maxDigit++;
    }
    int[][] buckets = new int[10][a.length];
    int base = 10;

    //从低位到高位,对每一位遍历,将所有元素分配到桶中
    for (int i = 0; i < maxDigit; i++) {
        //存储各个桶中存储元素的数量
        int[] bucketLen = new int[10];

        //收集:将不同桶里数据挨个捞出来,为下一轮高位排序做准备,由于靠近桶底的元素排名靠前,因此从桶底先捞
        for (int j = 0; j < a.length; j++) {
            int whichBucket = (a[j] % base) / (base / 10);
            buckets[whichBucket][bucketLen[whichBucket]] = a[j];
            bucketLen[whichBucket]++;
        }

        int k = 0;
        //收集:将不同桶里数据挨个捞出来,为下一轮高位排序做准备,由于靠近桶底的元素排名靠前,因此从桶底先捞
        for (int l = 0; l < buckets.length; l++) {
            for (int m =0; m < bucketLen[l]; m++) {
                a[k++] = buckets[l][m];
            }
        }
        System.out.println("Sorting: " + Arrays.toString(a));
        base *= 10;
    }
    System.out.println("基数排序: " + Arrays.toString(array));
}

10.4 算法分析

最佳情况:O(d(n+r)) 最差情况:O(d(n+r)) 平均情况:O(d*(n+r)) 空间复杂度: O(n+r)

其中,d 为位数,r 为基数,n 为原数组个数。在基数排序中,因为没有比较操作,所以在复杂上,最好的情况与最坏的情况在时间上是一致的,均为 O(d*(n + r))。

基数排序更适合用于对时间, 字符串等这些整体权值未知的数据进行排序,适用于。

(1)数据范围较小,建议在小于1000

(2)每个数值都要大于等于0

基数排序 vs 计数排序 vs 桶排序

这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

  • 基数排序:根据键值的每位数字来分配桶
  • 计数排序:每个桶只存储单一键值
  • 桶排序:每个桶存储一定范围的数值

参考资料:

https://juejin.im/post/5b95da8a5188255c775d8124

https://www.cnblogs.com/guoyaohua/p/8600214.html

https://www.cnblogs.com/Young111/p/11300929.html

快速排序详解


  TOC