天天看點

程式員必須知道的10大基礎實用算法及其講解

程式員必須知道的10大基礎實用算法及其講解

算法一:快速排序算法

快速排序是由東尼·霍爾所發展的一種排序算法。在平均狀況下,排序 n 個項目要Ο(n log

n)次比較。在最壞狀況下則需要Ο(n2)次比較,但這種狀況并不常見。事實上,快速排序通常明顯比其他Ο(n log n)

算法更快,因為它的内部循環(inner loop)可以在大部分的架構上很有效率地被實作出來。

快速排序使用分治法(divide and conquer)政策來把一個串行(list)分為兩個子串行(sub-lists)。

程式員必須知道的10大基礎實用算法及其講解

算法步驟:

1 從數列中挑出一個元素,稱為 “基準”(pivot)。

2 重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分區退出之後,該基準就處于數列的中間位置。這個稱為分區(partition)操作。

3 遞歸地(recursive)把小于基準值元素的子數列和大于基準值元素的子數列排序。

遞歸的最底部情形,是數列的大小是零或一,也就是永遠都已經被排序好了。雖然一直遞歸下去,但是這個算法總會退出,因為在每次的疊代(iteration)中,它至少會把一個元素擺到它最後的位置去。

算法二:堆排序算法

堆排序(heapsort)是指利用堆這種資料結構所設計的一種排序算法。堆積是一個近似完全二叉樹的結構,并同時滿足堆積的性質:即子結點的鍵值或索引總是小于(或者大于)它的父節點。

堆排序的平均時間複雜度為Ο(nlogn) 。

程式員必須知道的10大基礎實用算法及其講解

1. 建立一個堆h[0..n-1]。

2.把堆首(最大值)和堆尾互換。

3. 把堆的尺寸縮小1,并調用shift_down(0),目的是把新的數組頂端資料調整到相應位置。

4. 重複步驟2,直到堆的尺寸為1。

算法三:歸并排序

歸并排序(merge sort,台灣譯作:合并排序)是建立在歸并操作上的一種有效的排序算法。該算法是采用分治法(divide and conquer)的一個非常典型的應用。

1. 申請空間,使其大小為兩個已經排序序列之和,該空間用來存放合并後的序列。

2. 設定兩個指針,最初位置分别為兩個已經排序序列的起始位置。

3. 比較兩個指針所指向的元素,選擇相對小的元素放入到合并空間,并移動指針到下一位置。

4. 重複步驟3直到某一指針達到序列尾。

5. 将另一序列剩下的所有元素直接複制到合并序列尾。

程式員必須知道的10大基礎實用算法及其講解

算法四:二分查找算法

二分查找算法是一種在有序數組中查找某一特定元素的搜尋算法。搜素過程從數組的中間元素開始,如果中間元素正好是要查找的元素,則搜素過程結束;如果某一特定元素大于或者小于中間元素,則在數組大于或小于中間元素的那一半中查找,而且跟開始一樣從中間元素開始比較。如果在某一步驟數組為空,則代表找不到。這種搜尋算法每一次比較都使搜尋範圍縮小一半。折半搜尋每次把搜尋區域減少一半,時間複雜度為Ο(logn)

算法五:bfprt(線性查找算法)

bfprt算法解決的問題十分經典,即從某n個元素的序列中選出第k大(第k小)的元素,通過巧妙的分析,bfprt可以保證在最壞情況下仍為線性時間複雜度。該算法的思想與快速排序思想相似,當然,為使得算法在最壞情況下,依然能達到o(n)的時間複雜度,五位算法作者做了精妙的處理。

1. 将n個元素每5個一組,分成n/5(上界)組。

2. 取出每一組的中位數,任意排序方法,比如插入排序。

3. 遞歸的調用selection算法查找上一步中所有中位數的中位數,設為x,偶數個中位數的情況下設定為選取中間小的一個。

4. 用x來分割數組,設小于等于x的個數為k,大于x的個數即為n-k。

5. 若i==k,傳回x;若ik,在大于x的元素中遞歸查找第i-k小的元素。

終止條件:n=1時,傳回的即是i小元素。

算法六:dfs(深度優先搜尋)

深度優先搜尋算法(depth-first-search),是搜尋算法的一種。它沿着樹的深度周遊樹的節點,盡可能深的搜尋樹的分支。當節點v的所有邊都己被探尋過,搜尋将回溯到發現節點v的那條邊的起始節點。這一過程一直進行到已發現從源節點可達的所有節點為止。如果還存在未被發現的節點,則選擇其中一個作為源節點并重複以上過程,整個程序反複進行直到所有節點都被通路為止。dfs屬于盲目搜尋。

深度優先搜尋是圖論中的經典算法,利用深度優先搜尋算法可以産生目标圖的相應拓撲排序表,利用拓撲排序表可以友善的解決很多相關的圖論問題,如最大路徑問題等等。一般用堆資料結構來輔助實作dfs算法。

深度優先周遊圖算法步驟:

1. 通路頂點v。

2. 依次從v的未被通路的鄰接點出發,對圖進行深度優先周遊;直至圖中和v有路徑相通的頂點都被通路。

3. 若此時圖中尚有頂點未被通路,則從一個未被通路的頂點出發,重新進行深度優先周遊,直到圖中所有頂點均被通路過為止。

上述描述可能比較抽象,舉個執行個體:

dfs 在通路圖中某一起始頂點 v 後,由 v 出發,通路它的任一鄰接頂點 w1;再從 w1 出發,通路與 w1鄰 接但還沒有通路過的頂點 w2;然後再從 w2 出發,進行類似的通路,… 如此進行下去,直至到達所有的鄰接頂點都被通路過的頂點 u 為止。

接着,退回一步,退到前一次剛通路過的頂點,看是否還有其它沒有被通路的鄰接頂點。如果有,則通路此頂點,之後再從此頂點出發,進行與前述類似的通路;如果沒有,就再退回一步進行搜尋。重複上述過程,直到連通圖中所有頂點都被通路過為止。

算法七:bfs(廣度優先搜尋)

廣度優先搜尋算法(breadth-first-search),是一種圖形搜尋算法。簡單的說,bfs是從根節點開始,沿着樹(圖)的寬度周遊樹(圖)的節點。如果所有節點均被通路,則算法中止。bfs同樣屬于盲目搜尋。一般用隊列資料結構來輔助實作bfs算法。

1. 首先将根節點放入隊列中。

2. 從隊列中取出第一個節點,并檢驗它是否為目标。如果找到目标,則結束搜尋并回傳結果,否則将它所有尚未檢驗過的直接子節點加入隊列中。

3. 若隊列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目标。結束搜尋并回傳“找不到目标”。

4. 重複步驟2。

程式員必須知道的10大基礎實用算法及其講解

算法八:dijkstra算法

戴克斯特拉算法(dijkstra’s algorithm)是由荷蘭計算機科學家艾茲赫爾·戴克斯特拉提出。迪科斯徹算法使用了廣度優先搜尋解決非負權有向圖的單源最短路徑問題,算法最終得到一個最短路徑樹。該算法常用于路由算法或者作為其他圖算法的一個子子產品。

該算法的輸入包含了一個有權重的有向圖 g,以及g中的一個來源頂點 s。我們以 v 表示 g

中所有頂點的集合。每一個圖中的邊,都是兩個頂點所形成的有序元素對。(u, v) 表示從頂點 u 到 v 有路徑相連。我們以 e

表示g中所有邊的集合,而邊的權重則由權重函數 w: e → [0, ∞] 定義。是以,w(u, v) 就是從頂點 u 到頂點 v

的非負權重(weight)。邊的權重可以想像成兩個頂點之間的距離。任兩點間路徑的權重,就是該路徑上所有邊的權重總和。已知有 v 中有頂點 s 及

t,dijkstra 算法可以找到 s 到 t的最低權重路徑(例如,最短路徑)。這個算法也可以在一個圖中,找到從一個頂點 s

到任何其他頂點的最短路徑。對于不含負權的有向圖,dijkstra算法是目前已知的最快的單源最短路徑算法。

1. 初始時令 s={v0},t={其餘頂點},t中頂點對應的距離值,若存在,d(v0,vi)為弧上的權值,若不存在,d(v0,vi)為∞。

2. 從t中選取一個其距離值為最小的頂點w且不在s中,加入s。

3. 對其餘t中頂點的距離值進行修改:若加進w作中間頂點,從v0到vi的距離值縮短,則修改此距離值。

4.重複上述步驟2、3,直到s中包含所有頂點,即w=vi為止。

程式員必須知道的10大基礎實用算法及其講解

算法九:動态規劃算法

動态規劃(dynamic programming)是一種在數學、計算機科學和經濟學中使用的,通過把原問題分解為相對簡單的子問題的方式求解複雜問題的方法。 動态規劃常常适用于有重疊子問題和最優子結構性質的問題,動态規劃方法所耗時間往往遠少于樸素解法。

動态規劃背後的基本思想非常簡單。大緻上,若要解一個給定問題,我們需要解其不同部分(即子問題),再合并子問題的解以得出原問題的解。

通常許多子問題非常相似,為此動态規劃法試圖僅僅解決每個子問題一次,進而減少計算量:

一旦某個給定子問題的解已經算出,則将其記憶化存儲,以便下次需要同一個子問題解之時直接查表。

這種做法在重複子問題的數目關于輸入的規模呈指數增長時特别有用。

關于動态規劃最經典的問題當屬背包問題。

1. 最優子結構性質。如果問題的最優解所包含的子問題的解也是最優的,我們就稱該問題具有最優子結構性質(即滿足最優化原理)。最優子結構性質為動态規劃算法解決問題提供了重要線索。

2.

子問題重疊性質。子問題重疊性質是指在用遞歸算法自頂向下對問題進行求解時,每次産生的子問題并不總是新問題,有些子問題會被重複計算多次。動态規劃算法正是利用了這種子問題的重疊性質,對每一個子問題隻計算一次,然後将其計算結果儲存在一個表格中,當再次需要計算已經計算過的子問題時,隻是在表格中簡單地檢視一下結果,進而獲得較高的效率。

算法十:樸素貝葉斯分類算法

樸素貝葉斯分類算法是一種基于貝葉斯定理的簡單機率分類算法。貝葉斯分類的基礎是機率推理,就是在各種條件的存在不确定,僅知其出現機率的情況下,如何完成推理和決策任務。機率推理是與确定性推理相對應的。而樸素貝葉斯分類器是基于獨立假設的,即假設樣本每個特征與其他特征都不相關。

樸素貝葉斯分類器依靠精确的自然機率模型,在有監督學習的樣本集中能擷取得非常好的分類效果。在許多實際應用中,樸素貝葉斯模型參數估計使用最大似然估計方法,換言之樸素貝葉斯模型能工作并沒有用到貝葉斯機率或者任何貝葉斯模型。

盡管是帶着這些樸素思想和過于簡單化的假設,但樸素貝葉斯分類器在很多複雜的現實情形中仍能夠取得相當好的效果。

來源:51cto

繼續閱讀