天天看點

徹底搞懂堆排序

一、準備知識

1.堆

堆(英語:heap)是計算機科學中一類特殊的資料結構的統稱。堆通常是一個可以被看做一棵樹的數組對象。堆總是滿足下列性質:
  • 堆中某個節點的值總是不大于或不小于其父節點的值;
  • 堆總是一棵完全二叉樹。

将根節點最大的堆叫做最大堆或大根堆,根節點最小的堆叫做最小堆或小根堆。常見的堆有二叉堆、斐波那契堆等。

堆是線性資料結構,相當于一維數組,有唯一後繼。

堆的定義如下:n個元素的序列{k1,k2,ki,…,kn}當且僅當滿足下關系時,稱之為堆。

(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4...n/2)

若将和此次序列對應的一維數組(即以一維數組作此序列的存儲結構)看成是一個完全二叉樹,則堆的含義表明,完全二叉樹中所有非終端結點的值均不大于(或不小于)其左、右孩子結點的值。由此,若序列{k1,k2,…,kn}是堆,則堆頂元素(或完全二叉樹的根)必為序列中n個元素的最小值(或最大值)。

2.最大堆

把根節點最大的堆叫最大堆。

二、堆排序的思想

堆排序是将一個數組通過數組下标關系虛構出一個最大堆,這樣這個最大堆的根節點是最大的,然後将這個堆的最後一個節點和根節點交換,這個最大值就到了數組的最後,然後數組的長度減一,減一後的數組在調整順序,使其再次成為一個最大堆,這是根節點就是第二大的元素,然後将重複上面的步驟,知道全部交換完畢,數組就排好了順序。

三、排序

1.将數組構造為一個虛拟的最大堆

通過下标來構造這個最大堆。

(1)數組下标和堆元素的對應關系。

通過上面的圖,我們可以分析出,一個節點,我們可以使用(n-1)/2來計算它的父節點的坐标、使用2*n+1來計算它的左節點的坐标、使用2*n+2來計算它的右節點的坐标。

(2)構造最大堆

周遊整個數組,構造一個最大堆,每次插入一個數,然後使堆重新成為一個最大堆。構造過程如下:

  • 首先将1加入堆,這時堆中隻有一個元素,數組現在為[1,2,3,4,5,6,7]。
  • 将2加入堆中,計算2的父節點(1-1)/2=0,2的父節點是數組下标為0的元素。這時候2成為了1的左節點,根節點小于子節點,不滿足最大堆的定義,是以調整這個堆,讓根節點最大,是以1,2交換位置,數組現在為[2,1,3,4,5,6,7]。
  • 将3加入堆中,計算3的父節點(2-1)/2=0,3的父節點是數組下标為0的元素。這時候3成為了2的右節點,發現根節點2小于3,調整堆,将根節點2和3交換位置,現在數組為[3,1,2,4,5,6,7]。
  • 重複上面的步驟,将每一個元素加入這個堆,加入一個節點後,對比加入的節點和它的父節點的大小,如果新加入的節點大于它的父節點,則将兩者交換,然後在比較交換後的節點和它的父節點的大小,知道使堆重新成為一個最大堆。

    構造過程代碼:

2. 通過堆的結構調整來排序。

    通過上面的構造,我們已将一個數組通過下标關系構造成為了一個虛拟的最大堆,這時候我們知道這個最大堆的根節點(也就是數組的第一個元素)現在肯定是所有數字中最大的一個,然後根據這個已知關系調整這個堆,來達到排序的目的。

調整過程如下:

  • 将數組的第一個元素和數組的最後一個元素交換位置,這樣最大的那個數就到了數組的最後,然後數組長度減一,将最後一個數排除在外,剩餘的數重新調整順序,重新成為一個最大堆,這樣根節點就變成了一個次大的元素。
  • 然後再次将根元素和現在的最後一個元素(原數組的倒數第二個元素)交換位置,數組長度在減一,然後重新調整堆使其再次成為一個最大堆。
  • 重複上面的步驟,直到所有的數字都調整完畢,這時數組就排好了順序。

數組調整過程:

  • 找出目前節點和它的左節點、右節點三者中最大的那個節點,如果最大的節點是它自己則不做任何調整,如果最大的節點是它的左節點或者右節點,則和該節點交換位置,然後将交換後的節點作為目前節點在重複判斷。
  • 重複上面的步驟,使其重新成為一個最大堆。

調整過程代碼如下:

四、完整代碼

public class HeapSort {
                 public void heapSort(int[] arr) {
                     for (int i = 0; i < arr.length; i++) {
                         heapInsert(arr, i);
                     }
                     int heapSize = arr.length;
                     while (heapSize > 1) {
                         heapify(arr, --heapSize);
                     }
                 }

                 private void heapInsert(int[] arr,int i) {
                   int last = (i - 1) / 2; //計算父節點
                   while (arr[i] > arr[last]) { // 比較目前節點和父節點
                       //調整堆
                      swap(arr,i,last);
                           //繼續判斷他的上一層節點是否滿足最大堆
                       i = last;
                       last = (i - 1) / 2;
                   }
               }

             public void heapify(int[] arr, int heapSize) {
               swap(arr, 0, heapSize--);
               int cur = 0;
               while (2 * cur + 1 <= heapSize) {
                   int left = 2 * cur + 1;
                   int right = 2 * cur + 2;
                   int lastMax = heapSize >= right && arr[left] > arr[right] ?
                           arr[left] > arr[cur] ? left : cur
                           : heapSize >= right ?
                           arr[right] > arr[cur] ? right : cur :
                           arr[left] > arr[cur]
                           ? left : cur;
                   if (lastMax == cur) {
                       break;
                   }
                   int temp = arr[cur];
                   arr[cur] = arr[lastMax];
                   arr[lastMax] = temp;
                   cur = lastMax;
               }
             }

             public void swap(int[] arr, int i, int j) {
               int temp = arr[i];
               arr[i] = arr[j];
               arr[j] = temp;
             }

             @Test
             public void test() {
                 int[] arr = {1,2,3,4,5,6,7};
                 int[] arr1 = Arrays.copyOf(arr, arr.length);
                 heapSort(arr);
                 Arrays.sort(arr1);
                 Assert.assertArrayEquals(arr, arr1);
               }
              }  
           

五、複雜度。

時間複雜度:O(nlogn)

空間複雜度:O(1)