天天看点

彻底搞懂堆排序

一、准备知识

1.堆

堆(英语:heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质:
  • 堆中某个节点的值总是不大于或不小于其父节点的值;
  • 堆总是一棵完全二叉树。

将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆是线性数据结构,相当于一维数组,有唯一后继。

堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。

(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4...n/2)

若将和此次序列对应的一维数组(即以一维数组作此序列的存储结构)看成是一个完全二叉树,则堆的含义表明,完全二叉树中所有非终端结点的值均不大于(或不小于)其左、右孩子结点的值。由此,若序列{k1,k2,…,kn}是堆,则堆顶元素(或完全二叉树的根)必为序列中n个元素的最小值(或最大值)。

2.最大堆

把根节点最大的堆叫最大堆。

二、堆排序的思想

堆排序是将一个数组通过数组下标关系虚构出一个最大堆,这样这个最大堆的根节点是最大的,然后将这个堆的最后一个节点和根节点交换,这个最大值就到了数组的最后,然后数组的长度减一,减一后的数组在调整顺序,使其再次成为一个最大堆,这是根节点就是第二大的元素,然后将重复上面的步骤,知道全部交换完毕,数组就排好了顺序。

三、排序

1.将数组构造为一个虚拟的最大堆

通过下标来构造这个最大堆。

(1)数组下标和堆元素的对应关系。

通过上面的图,我们可以分析出,一个节点,我们可以使用(n-1)/2来计算它的父节点的坐标、使用2*n+1来计算它的左节点的坐标、使用2*n+2来计算它的右节点的坐标。

(2)构造最大堆

遍历整个数组,构造一个最大堆,每次插入一个数,然后使堆重新成为一个最大堆。构造过程如下:

  • 首先将1加入堆,这时堆中只有一个元素,数组现在为[1,2,3,4,5,6,7]。
  • 将2加入堆中,计算2的父节点(1-1)/2=0,2的父节点是数组下标为0的元素。这时候2成为了1的左节点,根节点小于子节点,不满足最大堆的定义,所以调整这个堆,让根节点最大,所以1,2交换位置,数组现在为[2,1,3,4,5,6,7]。
  • 将3加入堆中,计算3的父节点(2-1)/2=0,3的父节点是数组下标为0的元素。这时候3成为了2的右节点,发现根节点2小于3,调整堆,将根节点2和3交换位置,现在数组为[3,1,2,4,5,6,7]。
  • 重复上面的步骤,将每一个元素加入这个堆,加入一个节点后,对比加入的节点和它的父节点的大小,如果新加入的节点大于它的父节点,则将两者交换,然后在比较交换后的节点和它的父节点的大小,知道使堆重新成为一个最大堆。

    构造过程代码:

2. 通过堆的结构调整来排序。

    通过上面的构造,我们已将一个数组通过下标关系构造成为了一个虚拟的最大堆,这时候我们知道这个最大堆的根节点(也就是数组的第一个元素)现在肯定是所有数字中最大的一个,然后根据这个已知关系调整这个堆,来达到排序的目的。

调整过程如下:

  • 将数组的第一个元素和数组的最后一个元素交换位置,这样最大的那个数就到了数组的最后,然后数组长度减一,将最后一个数排除在外,剩余的数重新调整顺序,重新成为一个最大堆,这样根节点就变成了一个次大的元素。
  • 然后再次将根元素和现在的最后一个元素(原数组的倒数第二个元素)交换位置,数组长度在减一,然后重新调整堆使其再次成为一个最大堆。
  • 重复上面的步骤,直到所有的数字都调整完毕,这时数组就排好了顺序。

数组调整过程:

  • 找出当前节点和它的左节点、右节点三者中最大的那个节点,如果最大的节点是它自己则不做任何调整,如果最大的节点是它的左节点或者右节点,则和该节点交换位置,然后将交换后的节点作为当前节点在重复判断。
  • 重复上面的步骤,使其重新成为一个最大堆。

调整过程代码如下:

四、完整代码

public class HeapSort {
                 public void heapSort(int[] arr) {
                     for (int i = 0; i < arr.length; i++) {
                         heapInsert(arr, i);
                     }
                     int heapSize = arr.length;
                     while (heapSize > 1) {
                         heapify(arr, --heapSize);
                     }
                 }

                 private void heapInsert(int[] arr,int i) {
                   int last = (i - 1) / 2; //计算父节点
                   while (arr[i] > arr[last]) { // 比较当前节点和父节点
                       //调整堆
                      swap(arr,i,last);
                           //继续判断他的上一层节点是否满足最大堆
                       i = last;
                       last = (i - 1) / 2;
                   }
               }

             public void heapify(int[] arr, int heapSize) {
               swap(arr, 0, heapSize--);
               int cur = 0;
               while (2 * cur + 1 <= heapSize) {
                   int left = 2 * cur + 1;
                   int right = 2 * cur + 2;
                   int lastMax = heapSize >= right && arr[left] > arr[right] ?
                           arr[left] > arr[cur] ? left : cur
                           : heapSize >= right ?
                           arr[right] > arr[cur] ? right : cur :
                           arr[left] > arr[cur]
                           ? left : cur;
                   if (lastMax == cur) {
                       break;
                   }
                   int temp = arr[cur];
                   arr[cur] = arr[lastMax];
                   arr[lastMax] = temp;
                   cur = lastMax;
               }
             }

             public void swap(int[] arr, int i, int j) {
               int temp = arr[i];
               arr[i] = arr[j];
               arr[j] = temp;
             }

             @Test
             public void test() {
                 int[] arr = {1,2,3,4,5,6,7};
                 int[] arr1 = Arrays.copyOf(arr, arr.length);
                 heapSort(arr);
                 Arrays.sort(arr1);
                 Assert.assertArrayEquals(arr, arr1);
               }
              }  
           

五、复杂度。

时间复杂度:O(nlogn)

空间复杂度:O(1)