天天看點

GitHub熱門項目:使用Python實作所有算法

學會了Python基礎知識,想進階一下,那就來點算法吧!畢竟程式設計語言隻是工具,結構算法才是靈魂。

新手如何入門Python算法?

幾位印度小哥在GitHub上建了一個各種Python算法的新手入門大全。從原理到代碼,全都給你交代清楚了。為了讓新手更加直覺的了解,有的部分還配了動圖。

GitHub熱門項目:使用Python實作所有算法

标星已經達到2.7W

給出Github位址☟

https://github.com/TheAlgorithms/Python

這個項目主要包括兩部分内容:一是各種算法的基本原理講解,二是各種算法的代碼實作。

算法的代碼實作

算法的代碼實作給的資料也比較豐富,除了算法基礎原理部分的Python代碼,還有包括神經網絡、機器學習、數學等等代碼實作。

GitHub熱門項目:使用Python實作所有算法

例如在神經網絡部分,給出了BP神經網絡、卷積神經網絡、全卷積神經網絡以及感覺機等。

GitHub熱門項目:使用Python實作所有算法

卷積神經網絡代碼示例

代碼以Python檔案格式儲存在Github上,需要的同學可以自行儲存下載下傳。

再次給出github位址:

算法原理

在算法原理部分主要介紹了排序算法、搜尋算法、插值算法、跳躍搜尋算法、快速選擇算法、禁忌搜尋算法、加密算法等。

當然,除了文字解釋之外,還給出了幫助更好了解算法的相應資源連結,包括維基百科、動畫互動網站連結。

例如,在一些算法部分中,其給出的動畫互動連結,非常完美幫助了解算法的運作機制。

GitHub熱門項目:使用Python實作所有算法

互動動畫位址:

https://www.toptal.com/developers/sorting-algorithms/bubble-sort

排序算法

冒泡排序

GitHub熱門項目:使用Python實作所有算法

冒泡排序,有時也被稱做沉降排序,是一種比較簡單的排序算法。這種算法的實作是通過周遊要排序的清單,把相鄰兩個不符合排列規則的資料項交換位置,然後重複周遊清單,直到不再出現需要交換的資料項。當沒有資料項需要交換時,則表明該清單已排序。

桶排序算法

GitHub熱門項目:使用Python實作所有算法

桶排序(Bucket sort) 或所謂的箱排序,是一個 排序算法 ,工作的原理是将數組分到有限數量的桶子裡。每個桶子再個别排序,有可能再使用别的排序算法或是以遞歸方式繼續使用桶排序進行排序。

雞尾酒排序

GitHub熱門項目:使用Python實作所有算法

雞尾酒排序,也就是定向冒泡排序,雞尾酒攪拌排序,攪拌排序(也可以視作選擇排序的一種變形),漣漪排序,來回排序或快樂小時排序,都是冒泡排序的一種變形。此算法與冒泡排序的不同處在于排序時是以雙向在序列中進行排序。

譯者注:

雞尾酒排序等于是冒泡排序的輕微變形。不同的地方在于從低到高然後從高到低,而冒泡排序則僅從低到高去比較序列裡的每個元素。他可以得到比冒泡排序稍微好一點的性能,原因是冒泡排序隻從一個方向進行比對(由低到高),每次循環隻移動一個項目。

以序列(2,3,4,5,1)為例,雞尾酒排序隻需要通路一次序列就可以完成排序,但如果使用冒泡排序則需要四次。但是在随機數序列的狀态下,雞尾酒排序與冒泡排序的效率都很差勁。

插入排序

GitHub熱門項目:使用Python實作所有算法

插入排序(Insertion Sort)是一種簡單直覺的排序算法。它的工作原理是通過建構有序序列,對于未排序資料,在已排序序列中從後向前掃描,找到相應位置并插入。插入排序在實作上,通常采用in-place排序的額外空間的排序,因而在從後向前掃描過程中,需要反複把已排序元素逐漸向後挪位,為最新元素提供插入空間。

歸并排序

GitHub熱門項目:使用Python實作所有算法

歸并排序(Merge sort,或mergesort),是建立在歸并操作上的一種有效的排序算法,效率為O(n log n)(大O符号)。1945年由約翰·馮·諾伊曼首次提出。該算法是采用分治法(Divide and Conquer)的一個非常典型的應用,且各層分治遞歸可以同時進行。

堆(Heap)

GitHub熱門項目:使用Python實作所有算法

堆(Heap)是一種基于比較的排序算法。它可以被認為是一種改進的選擇排序。它将其輸入劃分為已排序和未排序的區域,并通過提取最大元素,将其移動到已排序區域來疊代縮小未排序區域。

Heap 始于 J._W._J._Williams 在 1964 年發表的堆排序(heap sort),當時他提出了二叉堆樹作為此算法的資料結構。

在隊列中,排程程式反複提取隊列中第一個作業并運作,因為實際情況中某些時間較短的任務将等待很長時間才能結束,或者某些不短小,但具有重要性的作業,同樣應當具有優先權。堆即為解決此類問題設計的一種資料結構。

基數排序

基數排序(Radix sort)是一種非比較型整數排序算法,其原理是将整數按位數切割成不同的數字,然後按每個位數分别比較。由于整數也可以表達字元串(比如名字或日期)和特定格式的浮點數,是以基數排序也不是隻能使用于整數。基數排序的發明可以追溯到1887年赫爾曼·何樂禮在打孔卡片制表機(Tabulation Machine)上的貢獻。

選擇排序

GitHub熱門項目:使用Python實作所有算法

選擇排序(Selection sort)是一種簡單直覺的排序算法。它的工作原理如下。首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然後,再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。以此類推,直到所有元素均排序完畢。

Shell排序

GitHub熱門項目:使用Python實作所有算法

ShellSort是插入排序的一種推廣,允許交換相距很遠的項。思路是安排元素清單,以便從任何地方開始,考慮到每個第n個元素都會給出一個排序清單。這樣的清單叫做h排序。等效地,可以被認為是h交錯清單,每個元素都是單獨排序的。

拓撲

拓撲排序或有向圖的拓撲排序是其頂點的線性排序,使得對于從頂點u到頂點v的每個有向邊uv,u在排序中位于v之前。例如,圖的頂點可以表示要執行的任務,并且邊可以表示一個任務必須在另一個之前執行的限制;在這個應用程式中,拓撲排序隻是任務的有效序列。當且僅當圖形沒有有向循環時,即,如果它是有向非循環圖,則拓撲排序是可能的(DAG)。任何DAG都具有至少一個拓撲排序,并且已知算法用于線上性時間内建構任何DAG的拓撲排序。

時間複雜折線圖

比較排序算法的複雜性(冒泡排序,插入排序,選擇排序)

GitHub熱門項目:使用Python實作所有算法

比較排序算法:

Quicksort是一種非常快速的算法,但實作起來相當棘手。Bubble sort是一種慢速算法,但很容易實作。為了對小資料集進行排序,冒泡排序可能是一個更好的選擇。

搜尋算法

線性搜尋

GitHub熱門項目:使用Python實作所有算法

線性搜尋或順序搜尋是用于在清單中查找目标值的方法。它按順序檢查清單中的每個元素的目标值,直到找到比對或直到搜尋完所有元素。

假設一個數組中有N個元素,最好的情況就是要尋找的特定值就是數組裡的第一個元素,這樣僅需要1次比較就可以。而最壞的情況是要尋找的特定值不在這個數組或者是數組裡的最後一個元素,這就需要進行N次比較。

Binary 二進制搜尋

GitHub熱門項目:使用Python實作所有算法

二進制搜尋,也稱為半間隔搜尋或對數搜尋,用于查找已排序數組中目标值的位置。它将目标值與數組的中間元素進行比較,如果它們不相等,則目标的一半被消除,并且在剩下的一半上繼續搜尋直到成功。

插值搜尋

插值搜尋是一種用于搜尋已按照鍵值的數值排序的數組中鍵的算法。

最先由WW Peterson在1957年描述。插值搜尋類似于人們在電話目錄中搜尋名稱的方法(用于訂購書籍條目的關鍵值):在每個步驟中,算法計算剩餘搜尋空間中的位置,基于搜尋空間邊界處的鍵值和所尋找的鍵的值,通常可以通過線性插值來尋找項目。

相比之下,二進制搜尋總是選擇剩餘搜尋空間的中間,丢棄一半或另一半,這取決于在估計位置找到的密鑰與所尋找的密鑰之間的比較。剩餘的搜尋空間縮小到估計位置之前或之後的部分。線性搜尋僅使用相等性,因為它從一開始就逐個比較元素,忽略任何排序。

平均插值搜尋使得log(log(n))比較(如果元素均勻分布),其中n是要搜尋的元素的數量。在最壞的情況下(例如,鍵的數值以指數方式增加),它可以構成O(n)比較。

在插值順序搜尋中,插值用于查找正在搜尋的項目附近的項目,然後使用線性搜尋來查找确切項目。

跳轉搜尋

跳轉搜尋是指有序清單的搜尋算法。它首先檢查所有項目的Lkm,其中K∈N,并且m是塊大小,直到找到大于搜尋關鍵字的項目。為了在清單中找到搜尋關鍵字的确切位置,在子清單L[(k-1)m,km]上執行線性搜尋。

m的最優值是√n,其中n是清單L的長度。因為算法的兩個步驟最多都是√n項,是以算法在O(√n)時間内運作。這比線性搜尋更好,但比二分搜尋差。優于後者的優點是跳轉搜尋隻需要向後跳一次,而二進制可以向後跳轉到記錄n次。

在最終執行線性搜尋之前,可以通過在子清單上執行多級跳轉搜尋來修改算法。對于k級跳躍搜尋,第l級的最佳塊大小ml(從1開始計數)是n(k1)/k。修改後的算法将執行k個向後跳轉并在O(kn1/(k+ 1))時間内運作。

快速選擇算法

GitHub熱門項目:使用Python實作所有算法

快速選擇(Quicksort)是一種從無序清單找到第k小元素的選擇算法。它從原理上來說與快速排序有關。與快速排序一樣都由托尼·霍爾提出的,因而也被稱為霍爾選擇算法。同樣地,它在實際應用是一種高效的算法,具有很好的平均時間複雜度,然而最壞時間複雜度則不理想。快速選擇及其變種是實際應用中最常使用的高效選擇算法。

快速選擇的總體思路與快速排序一緻,選擇一個元素作為基準來對元素進行分區,将小于和大于基準的元素分在基準左邊和右邊的兩個區域。不同的是,快速選擇并不遞歸通路雙邊,而是隻遞歸進入一邊的元素中繼續尋找。這降低了平均時間複雜度,從O(n log n)至O(n),不過最壞情況仍然是O(n2)。

禁忌搜尋

禁忌搜尋(Tabu Search,TS,又稱禁忌搜尋法)是一種現代啟發式算法,由美國科羅拉多大學教授Fred Glover在1986年左右提出的,是一個用來跳脫局部最優解的搜尋方法。其先創立一個初始化的方案;基于此,算法“移動”到一相鄰的方案。經過許多連續的移動過程,提高解的品質。

密碼

凱撒密碼

凱撒密碼,也稱為凱撒密碼,移位密碼,凱撒代碼或凱撒移位,是最簡單和最廣為人知的加密技術之一。

它是一種替換密碼,其中明文中的每個字母都被字母表中的一些固定數量的位置的字母替換。例如,左移3,D将被A替換,E将變為B,依此類推。

該方法以Julius Caesar的名字命名,最初是他在私人通信中使用了它。由Caesar密碼執行的加密步驟通常作為更複雜的方案的一部分,例如Vigenère密碼,并且仍然在ROT13系統中具有現代應用。與所有單字母替換密碼一樣,Caesar密碼很容易破解,在現代實踐中基本上沒有通信安全性。

Vigenère密碼

Vigenère密碼是一種通過使用基于關鍵字字母的一系列交織的凱撒密碼來加密字母文本的方法。它是一種多字母替代形式。

Vigenère密碼該方法最初由Giovan Battista Bellaso在其1553年的書“La cifra del”中提出。然而,該計劃後來在19世紀被誤用于BlaisedeVigenère,現在被廣泛稱為“Vigenère密碼”。

雖然該密碼易于了解和實施,但三個世紀以來它一直抵制所有打破密碼的企圖,是以也被稱為這lechiffreindéchiffrable(法語為“難以了解的密碼”)。Friedrich Kasiski是第一個在1863年發表破譯Vigenère密碼的通用方法。

轉置密碼

轉置密碼是一種加密方法,通過該加密方法,明文單元(通常是字元或字元組)所保持的位置根據正常系統移位,使得密文構成明文的排列。也就是說,機關的順序改變(明文被重新排序)。

在數學上,雙字元函數用于加密字元的位置和用于解密的反函數。

RSA (Rivest–Shamir–Adleman)

RSA加密算法是一種非對稱加密算法。在公開密鑰加密和電子商業中RSA被廣泛使用。RSA是1977年由羅納德·李維斯特(Ron Rivest)、阿迪·薩莫爾(Adi Shamir)和倫納德·阿德曼(Leonard Adleman)一起提出的。當時他們三人都在麻省理工學院工作。RSA就是他們三人姓氏開頭字母拼在一起組成的。

1973年,在英國政府通訊總部工作的數學家克利福德·柯克斯(Clifford Cocks)在一個内部檔案中提出了一個與之等效的算法,但該算法被列入機密,直到1997年才得到公開。

ROT13

GitHub熱門項目:使用Python實作所有算法

ROT13(“旋轉13個位置”,有時用連字元ROT-13)是一個簡單的字母替換密碼,用字母表後面的第13個字母替換一個字母。ROT13是古羅馬開發的Caesar密碼的特例。

因為基本拉丁字母中有26個字母(2×13),是以ROT13是自身的反轉,也就是說,要撤消ROT13需要相同的算法,是以可以使用相同的動作進行編碼和解碼。該算法幾乎不提供加密安全性,并且經常被引用為弱加密的典型示例。

Github位址:

GitHub熱門項目:使用Python實作所有算法