天天看点

查找算法总结

====================

顺序查找算法

1. 算法描述

  顺序比较即可。

2. 平均查找长度

  (n+1)/2, 其中n为表长。

3. 算法实现

    省略

4. 优化思想

  根据经验,目前被查到越多的元素,将来可能被查到的可能性也越大。所以可以考虑,每次查找到一个元素后,将它和直接前驱交换位置。

如果上述的经验从概率上来讲是成立的,则可以加快顺序查找的速度。

二分查找算法

  限制:待查表必须是有序的向量(在内存中连续存储)

  首先和数组中点比较,如果等于则返回,如果小于中点则在左边区间查找,如果大于中点则在右边区间查找。

  lg(n+1)

(1) 非递归方式

[cpp] 

view

plain

copy

  1. static const int ERROR = -1;   
  2. template<typename T>  
  3. int binary_search(T *array, const int size, const T & key)  
  4. {  
  5.  if(NULL == array || size < 1)  
  6.  {  
  7.   cout << "illegal input!" << endl;  
  8.   return ERROR;  
  9.  }  
  10.  int low = 0, high = size - 1;  
  11.  int mid_index = 0;  
  12.  while(low <= high)  
  13.   mid_index = (low+high)/2;  
  14.   if(key == array[mid_index])  
  15.   {  
  16.    return mid_index;  
  17.   }    
  18.   else if(key > array[mid_index])  
  19.    low = mid_index + 1;   
  20.   }  
  21.   else   
  22.    high = mid_index - 1;  
  23.  return ERROR;  
  24. }  

(2) 递归方式

  1. int binary_search_iter(T *array, const int low, const int high, const T & key)  
  2.  if(low > high)  
  3.   return -1;  
  4.  int mid_index = (low+high)/2;  
  5.  if(key == array[mid_index])  
  6.   return mid_index;  
  7.  else if(key > array[mid_index])  
  8.   return binary_search_iter(array, mid_index+1, high, key);  
  9.  else   
  10.   return binary_search_iter(array,low, mid_index-1, key);  

分块查找算法

1. 基本思想

    以增加空间复杂度为代价(存储每块中的最大值已经最大值的位置),为原数组做一个索引(索引本身是递增有序的),这样先查索引,再查块内位置。如果索引的选择科学有效,则可以获得比顺序查找快的速度。

2. 算法描述

   抽取各块中的最大关键字及其起始位置构成一个索引表ID[l..b],即: ID[i](1≤i≤b)中存放第i块的最大关键字及该块在表R中的起始位置。由于表R是分块有序的,所以索引表是一个递增有序表。

   先用二分法查到元素可能所在的块起始位置,而后在块内进行顺序查找。

3. 平均查找长度

   平均查找长度在顺序查找和二分查找之间,并且当结点数为元素数量的平方根时,查找长度最小。

=======================

二叉排序树上的查找

   由如何改进二分查找的缺陷(插入和删除操作需要移动大量的数据)而得出的一种算法,用二叉排序树存储数据,由于二叉树的插入和删除操作的时间复杂度相对低,而且也支持二分查找,所以在动态数据查找方面优于二分查找。

   二叉树的特点是中序遍历可以得到递增的序列。很容易可以得出在二叉排序树上进行二分排序的递归代码。

    和二叉排序树的形态有关。在极端情况下,二叉树只有单一的左或右分支,则查找长度为(n+1)/2;如果是平衡二叉树,则查找长度为lgn(树的层次)。

散列技术下的查找

    将元素的值和其位置直接对应,对应的方法就是散列函数(如平方取中,除余法等等);然而再好的散列函数也会引起冲突,则解决冲突的方法是如拉链法,线性探测法,二次探测法等等。

原文链接:

http://blog.csdn.net/fstar007/article/details/7230659

继续阅读