《算法导论》中堆排序主要将其分为堆的性质、维护堆的性质、建堆、堆排序算法
堆的性质:给定一个结点的下标i,很容易计算得到它的父结点、左孩子和右孩子的下标(伪代码):
PARENT(i)return i/2LEFT(i)return2i
RIGHT(i)return 2i+1
这里针对下标从1开始的数组,然而实际上我们涉及的数组都是从0开始。为了改进上面的伪代码,可以使用移位来解决,其伪代码:
PARENT(i)return (i-1)>>1LEFT(i)return ((i+1)<<1)-1RIGHT(i)return (i+1)<<1
维护堆的性质(MAX-HEAPIFY):
MAX-HEAPIFY是用于维护最大堆性质的重要过程。他输入为一个数据A和一个下标i,在调用MAX-HEAPIFY的时候,假定根节点为LEFT(i)和RIGHT(i)的二叉树都是最大堆,但这时A[i]有可能小于其孩子,这样就违背了最大堆的性质。MAX-HEAPIFY通过让A[i]的值在最大堆中“逐级下降”,从而使得以下标i为根结点的子树重新遵循最大堆的性质。其伪代码如下所示:
MAX-HEAPIFY(A, i)
l=LEFT(i);
r=RIGHT(i);if l <= A.heap-size and A[l] >A[i]
largest=largestelse largest =i;if r <= A.heap-size and A[r] >A[largest]
largest=rif largest !=i
exchangeA[i]withA[largest]
MAX-HEAPIFY(A, largest)
用Java语言实现维护堆的性质:MAXHeapify.java
packageheapsort;public classMaxHeapify {public void heapAdjust(int[] A, int i, intlen){int l =Left(i);int r =Right(i);int largest = i;//假设父节点值最大
if (l < len && A[l] > A[i]) {//左孩子值大于父节点值
largest =l;
}if (r < len && A[r] > A[largest]) {//右孩子值大于父节点值
largest =r;
}if (largest !=i) {//exchange A[i]withA[largest]
int tmp =A[i] ;
A[i]=A[largest];
A[largest]=tmp;
heapAdjust(A, largest, len);
}
}private int Right(int i) {//右孩子坐标
return ((i+1)<<1);//return 2*i+1;
}private int Left(int i) {//左孩子坐标
return ((i+1)<<1)-1;//return 2*i;
}
}
测试维护堆的性质代码即:MaxHeapifyTest.java
packageheapsort;public classMaxHeapifyTest {public static voidmain(String[] args) {int[] A ={16, 4, 10, 14, 7, 9, 3, 2, 8, 1};//int[] A={5, 2, 4, 6, 1, 3, 2, 6};
MaxHeapify maxHeapify = newMaxHeapify();
maxHeapify.heapAdjust(A,1, A.length);for (int i = 0; i < A.length; i++) {
System.out.print(A[i]+" ");
}
}
}
测试结果:
16 14 10 8 7 9 3 2 4 1
建堆(BUILD-MAX-HEAPIFY):
用自底向上的方法利用过程MAX-HEAPIFY把一个大小为n=A.length的数组A[1..n]转换为最大堆。通过一个证明:当用数组表示存储n个元素的堆时,叶节点下标分别为floor(n/2)+1,floor(n/2)+2,...,n。可知道,子数组A[floor(n/2)+1..n]中的元素都是树的叶结点。每个叶结点都可以看成只包含一个元素的堆。过程BUILD-MAX-HEAPIFY对树中的其他结点都调用一次MAX-HEAPIFY。其伪代码如下:
BUILD-MAX-HEAP(A)
A.heap-size =A.lengthfor i = floor(A.length/2) downto 1MAX-HEAPIFY(A, i)
用Java语言实现BUILD-MAX-HEAPIFY功能即:BuildHeap.java
packageheapsort;public classBuildHeap {public void buildMaxHeap(int[] A) {for (int i = A.length/2-1; i >= 0; i--) {
MaxHeapify maxHeapify= newMaxHeapify();
maxHeapify.heapAdjust(A, i, A.length);
}
}
}
测试建堆的功能即BuildHeapTest.java:
packageheapsort;public classBuildHeapTest {public static voidmain(String[] args) {int[] A = {4, 1, 3, 2, 16, 9, 10, 14, 8, 7};
BuildHeap buildHeap= newBuildHeap();
buildHeap.buildMaxHeap(A);for (int i = 0; i < A.length; i++) {
System.out.print(A[i]+" ");
}
}
}
测试结果:
16 14 10 8 7 9 3 2 4 1
堆排序算法:
初始时候,堆排序算法利用BUILD-MAX-HEAP将输入数组A[1..n]建成最大堆,其中n=A.length。因为数组中的最大元素总在根结点A[1]中,通过把它与A[n]进行互换,我们可以让该元素放到正确的位置。这时候,如果我们从堆中去掉结点n(这一操作可以通过减少A.heap-size的值来实现),剩余的结点中,原来根的孩子结点仍然是最大堆,而新的根结点可能会违背最大队的性质。为了维护最大堆的性质,我们要做的是调用MAX-HEAPIFY(A, 1),从而在A[1..n-1]上构造一个新的最大堆。堆排序算法会不断重复这一过程,直到堆的大小从n-1降到2.
HEAPSORT(A)
BUILD-MAX-HEAP(A)for i = A.length downto 2exchange A[1] with A[i]
A.heapsize= A.heapsize-1MAX-HEAPIFY(A, 1)
注意:本段伪代码数组下标从1开始,要想实现该段伪代码时候,要将下标改为0开始。
用Java代码实现堆排序即HeapSort.java:
packageheapsort;public classHeapSort {public HeapSort(int[] A) {
BuildHeap buildHeap= newBuildHeap();
buildHeap.buildMaxHeap(A);for (int i = A.length-1; i > 0; i--) {//exchange A[1]withA[i]
int tmp = A[0];
A[0] =A[i];
A[i]=tmp;//维护堆的性质
MaxHeapify maxHeapify = newMaxHeapify();
maxHeapify.heapAdjust(A,0, i);//A[0]为根结点
}
}
}
测试堆排序算法即HeapSortTest.java:
packageheapsort;public classHeapSortTest {public static voidmain(String[] args) {int[] A = {4, 1, 3, 2, 16, 9, 10, 14, 8, 7};
HeapSort heapSort= newHeapSort(A);for (int j = 0; j < A.length; j++) {
System.out.print(A[j]+" ");
}
}
}
测试结果:
1 2 3 4 7 8 9 10 14 16