介紹兩個Python web架構：Django & Tornado

http://www.cnblogs.com/wuvist/archive/2011/06/28/django-and-tornado.html

介紹兩個Python web架構：Django & Tornado

在各種語言平台中，python湧現的web架構恐怕是最多的；猜想原因應該是在py中構造架構十分簡單，使得輪子不斷被發明。

這裡記述一下我了解過的兩個py web架構，供大家參考，希望能起他山之石的作用。

====== Django ======

Django 應該是最出名的py架構，Google App Engine甚至Erlang都有架構受它影響。

Django是走大而全的方向，它最出名的是其全自動化的管理背景：隻需要使用起ORM，做簡單的對象定義，它就能自動生成資料庫結構、以及全功能的管理背景。

Django提供的友善，也意味着Django内置的ORM跟架構内的其他子產品耦合程度高。

應用程式必須使用Django内置的ORM，否則就不能享受到架構内提供的種種基于其ORM的便利；理論上可以切換掉其ORM子產品，但這就相當于要把裝修完畢的房子拆除重新裝修，倒不如一開始就去毛胚房做全新的裝修。

Django的賣點是超高的開發效率，其性能擴充有限；采用Django的項目，在流量達到一定規模後，都需要對其進行重構，才能滿足性能的要求。

這方面的經驗可以參考：http://www.slideshare.net/zeeg/djangocon-2010-scaling-disqus

Ruby的Rails也有類似的問題；以Twitter為例，推特到了今日的規模，不要說Rails，甚至是連Ruby都需要抛棄重來。

就我的感覺Django适用的是中小型的網站，或者是作為大型網站快速實作産品雛形的工具。

快速推出産品是王道：

Believe it or not, the bigger problem isn't scaling, it's getting to the point where you have to scale. Without the first problem you won't have the second. - http://gettingreal.37signals.com/ch04_Scale_Later.php

===== Django 模闆 =====

Django的模闆系統設計十分有意思，也應該其架構内影響最大、争議最大的部分。

Django模闆的設計哲學是徹底的将代碼、樣式分離；asp.net提倡将代碼/模闆分離，但技術上還是可以混合；而Django則是從根本上杜絕在模闆中進行編碼、處理資料的可能。

比方說，asp.net模闆中可以寫：

int i;

for(i==0;i<10;i++){

....

}

Django是徹底不支援嵌入類似上面的代碼，僅能使用其模闆内置的函數；這實際上，是為其模闆構造了一種“新語言”；由于此“新語言”十分簡單，是以也能夠将其模闆移植到不同平台。

大多數情況下，Django的模闆功能是足夠的，但對于特殊（有時“特殊”也不是十分特殊）的情況，還是需要在模闆中嵌入代碼，那麼就需要根據其模闆系統的規則做模闆擴充。有時候，模闆中直接寫一行代碼能夠解決的問題，用模闆擴充實作後，會變成十幾行代碼。

是否容忍在模闆中程式設計，正是Django模闆争議最大之處。

====== Tornado ======

Tornado( http://www.tornadoweb.org )是Facebook開源出來的架構，其哲學跟Django近乎兩個極端。

Tornado走的是少而精的方向，它也有提供模闆功能；雖然不鼓勵，但作者是可以允許在模闆進行少量編碼（直接嵌入單行py代碼）的。

如果跟asp.net相比，Tornado有點類似僅實作了AsyncHttpHandler；除此之外，全部需要自己去實作。

好吧，其實它有模闆，有國際化支援，甚至還有内置的OAuth/OpenID子產品，友善做第三方登入，它其實也直接實作了Http伺服器。

但它沒有ORM（僅有一個mysql的超簡單封裝），甚至沒有Session支援，更不要說Django那樣自動化的背景。

ORM對象關系映射，面向對象是從軟體工程基本原則(如耦合、聚合、封裝)的基礎上發展起來的，而關系資料庫則是從數學理論發展而來的，兩套理論存在顯著的差別。為了解決這個不比對的現象,對象關系映射技術應運而生。

你用O/R Mapping儲存，删除，讀取對象，O/R Mapping負責生成SQL，你隻需要關心對象就好。

假設是一個大型網站，在高性能的要求下，架構的各個部分往往都需要定制，可以複用的子產品非常少；一個以Django開發的網站，各部分經過不斷的定制，Django架構剩下的，很有可能也就是tornado一開始所能提供的這部分。

殊途同歸。

===== HTTP伺服器 =====

Tornado為了高效實作Comet/後端異步調用HTTP接口，是直接内嵌了HTTP伺服器。

前端無需加apache / lighttpd / nginx等也可以供浏覽器通路；但它并沒有完整實作HTTP 1.1的協定，是以官方文檔是推薦使用者在生産環境下在前端使用nginx，後端反向代理到多個Tornado執行個體。

Tornado本身是單線程的異步網絡程式，它預設啟動時，會根據CPU數量運作多個執行個體；充分利用CPU多核的優勢。

===== 單線程異步 =====

網站基本都會有資料庫操作，而Tornado是單線程的，這意味着如果資料庫查詢傳回過慢，整個伺服器響應會被堵塞。

資料庫查詢，實質上也是遠端的網絡調用；理想情況下，是将這些操作也封裝成為異步的；但Tornado對此并**沒有**提供任何支援。

這是Tornado的**設計**，而不是缺陷。

一個系統，要滿足高流量；是必須解決資料庫查詢速度問題的！

資料庫若存在查詢性能問題，整個系統無論如何優化，資料庫都會是瓶頸，拖慢整個系統！

異步并**不能**從本質上提到系統的性能；它僅僅是避免多餘的網絡響應等待，以及切換線程的CPU耗費。

如果資料庫查詢響應太慢，需要解決的是資料庫的性能問題；而不是調用資料庫的前端Web應用。

對于實時傳回的資料查詢，理想情況下需要確定所有資料都在記憶體中，資料庫硬碟IO應該為0；這樣的查詢才能足夠快；而如果資料庫查詢足夠快，那麼前端web應用也就無将資料查詢封裝為異步的必要。

就算是使用協程，異步程式對于同步程式始終還是會提高複雜性；需要衡量的是處理這些額外複雜性是否值得。

如果後端有查詢實在是太慢，無法繞過，Tornaod的建議是将這些查詢在後端封裝獨立封裝成為HTTP接口，然後使用Tornado内置的異步HTTP用戶端進行調用。

介紹兩個Python web架構：Django & Tornado