一、準備知識
1.堆
堆(英語:heap)是計算機科學中一類特殊的資料結構的統稱。堆通常是一個可以被看做一棵樹的數組對象。堆總是滿足下列性質:
- 堆中某個節點的值總是不大于或不小于其父節點的值;
- 堆總是一棵完全二叉樹。
将根節點最大的堆叫做最大堆或大根堆,根節點最小的堆叫做最小堆或小根堆。常見的堆有二叉堆、斐波那契堆等。
堆是線性資料結構,相當于一維數組,有唯一後繼。
堆的定義如下:n個元素的序列{k1,k2,ki,…,kn}當且僅當滿足下關系時,稱之為堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4...n/2)
若将和此次序列對應的一維數組(即以一維數組作此序列的存儲結構)看成是一個完全二叉樹,則堆的含義表明,完全二叉樹中所有非終端結點的值均不大于(或不小于)其左、右孩子結點的值。由此,若序列{k1,k2,…,kn}是堆,則堆頂元素(或完全二叉樹的根)必為序列中n個元素的最小值(或最大值)。
2.最大堆
把根節點最大的堆叫最大堆。
二、堆排序的思想
堆排序是将一個數組通過數組下标關系虛構出一個最大堆,這樣這個最大堆的根節點是最大的,然後将這個堆的最後一個節點和根節點交換,這個最大值就到了數組的最後,然後數組的長度減一,減一後的數組在調整順序,使其再次成為一個最大堆,這是根節點就是第二大的元素,然後将重複上面的步驟,知道全部交換完畢,數組就排好了順序。
三、排序
1.将數組構造為一個虛拟的最大堆
通過下标來構造這個最大堆。
(1)數組下标和堆元素的對應關系。
通過上面的圖,我們可以分析出,一個節點,我們可以使用(n-1)/2來計算它的父節點的坐标、使用2*n+1來計算它的左節點的坐标、使用2*n+2來計算它的右節點的坐标。
(2)構造最大堆
周遊整個數組,構造一個最大堆,每次插入一個數,然後使堆重新成為一個最大堆。構造過程如下:
- 首先将1加入堆,這時堆中隻有一個元素,數組現在為[1,2,3,4,5,6,7]。
- 将2加入堆中,計算2的父節點(1-1)/2=0,2的父節點是數組下标為0的元素。這時候2成為了1的左節點,根節點小于子節點,不滿足最大堆的定義,是以調整這個堆,讓根節點最大,是以1,2交換位置,數組現在為[2,1,3,4,5,6,7]。
- 将3加入堆中,計算3的父節點(2-1)/2=0,3的父節點是數組下标為0的元素。這時候3成為了2的右節點,發現根節點2小于3,調整堆,将根節點2和3交換位置,現在數組為[3,1,2,4,5,6,7]。
-
重複上面的步驟,将每一個元素加入這個堆,加入一個節點後,對比加入的節點和它的父節點的大小,如果新加入的節點大于它的父節點,則将兩者交換,然後在比較交換後的節點和它的父節點的大小,知道使堆重新成為一個最大堆。
構造過程代碼:
2. 通過堆的結構調整來排序。
通過上面的構造,我們已将一個數組通過下标關系構造成為了一個虛拟的最大堆,這時候我們知道這個最大堆的根節點(也就是數組的第一個元素)現在肯定是所有數字中最大的一個,然後根據這個已知關系調整這個堆,來達到排序的目的。
調整過程如下:
- 将數組的第一個元素和數組的最後一個元素交換位置,這樣最大的那個數就到了數組的最後,然後數組長度減一,将最後一個數排除在外,剩餘的數重新調整順序,重新成為一個最大堆,這樣根節點就變成了一個次大的元素。
- 然後再次将根元素和現在的最後一個元素(原數組的倒數第二個元素)交換位置,數組長度在減一,然後重新調整堆使其再次成為一個最大堆。
- 重複上面的步驟,直到所有的數字都調整完畢,這時數組就排好了順序。
數組調整過程:
- 找出目前節點和它的左節點、右節點三者中最大的那個節點,如果最大的節點是它自己則不做任何調整,如果最大的節點是它的左節點或者右節點,則和該節點交換位置,然後将交換後的節點作為目前節點在重複判斷。
- 重複上面的步驟,使其重新成為一個最大堆。
調整過程代碼如下:
四、完整代碼
public class HeapSort {
public void heapSort(int[] arr) {
for (int i = 0; i < arr.length; i++) {
heapInsert(arr, i);
}
int heapSize = arr.length;
while (heapSize > 1) {
heapify(arr, --heapSize);
}
}
private void heapInsert(int[] arr,int i) {
int last = (i - 1) / 2; //計算父節點
while (arr[i] > arr[last]) { // 比較目前節點和父節點
//調整堆
swap(arr,i,last);
//繼續判斷他的上一層節點是否滿足最大堆
i = last;
last = (i - 1) / 2;
}
}
public void heapify(int[] arr, int heapSize) {
swap(arr, 0, heapSize--);
int cur = 0;
while (2 * cur + 1 <= heapSize) {
int left = 2 * cur + 1;
int right = 2 * cur + 2;
int lastMax = heapSize >= right && arr[left] > arr[right] ?
arr[left] > arr[cur] ? left : cur
: heapSize >= right ?
arr[right] > arr[cur] ? right : cur :
arr[left] > arr[cur]
? left : cur;
if (lastMax == cur) {
break;
}
int temp = arr[cur];
arr[cur] = arr[lastMax];
arr[lastMax] = temp;
cur = lastMax;
}
}
public void swap(int[] arr, int i, int j) {
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
@Test
public void test() {
int[] arr = {1,2,3,4,5,6,7};
int[] arr1 = Arrays.copyOf(arr, arr.length);
heapSort(arr);
Arrays.sort(arr1);
Assert.assertArrayEquals(arr, arr1);
}
}
五、複雜度。
時間複雜度:O(nlogn)
空間複雜度:O(1)