天天看點

Comet技術詳解:基于HTTP長連接配接的Web端實時通信技術前言 學習交流概述“伺服器推”(Comet技術)的應用範圍來看看更傳統的基于用戶端套接口的“伺服器推”技術 基于 HTTP 長連接配接的“伺服器推”技術:Comet技術 使用 Comet 模型開發自己的應用 Comet開源工程推薦系列文章

前言

一般來說,Web端即時通訊技術因受限于浏覽器的設計限制,一直以來實作起來并不容易,主流的Web端即時通訊方案大緻有4種:傳統Ajax短輪詢、Comet技術、WebSocket技術、SSE(Server-sent Events)。

關于這4種技術方式的優缺點,請參考《

Web端即時通訊技術盤點:短輪詢、Comet、Websocket、SSE

》。本文将專門講解Comet技術。(本文同步釋出于:

http://www.52im.net/thread-334-1-1.html

學習交流

- 即時通訊開發交流群:

215891622

 [推薦]

- 更多即時通訊技術資料:

http://www.52im.net/forum.php?mod=collection&op=all

概述

本文将介紹如何在現有的技術基礎上選擇合适的方案開發一個“伺服器推”(Comet技術)的應用,最優的方案還是取決于應用需求的本身。相對于傳統的 Web 應用, 開發 Comet 應用具有一定的挑戰性。

在WebSocket技術沒有完全解決浏覽器相容問題前,“伺服器推”(Comet技術)存在廣泛的應用需求,需求推動技術的發展,Comet 技術在Web端即時通訊的方案裡幾乎不可或缺。

“伺服器推”(Comet技術)的應用範圍

傳統模式的 Web 系統以用戶端送出請求、伺服器端響應的方式工作。這種方式并不能滿足很多現實應用的需求,譬如:

1] 監控系統:背景硬體熱插拔、LED、溫度、電壓發生變化;

2] 即時通信系統:其它使用者登入、發送資訊;

3] 即時報價系統:背景資料庫内容發生變化。

這些應用都需要伺服器能實時地将更新的資訊傳送到用戶端,而無須用戶端送出請求。“伺服器推”技術在現實應用中有一些解決方案,本文将這些解決方案分為兩類:一類需要在浏覽器端安裝插件,基于套接口傳送資訊,或是使用 RMI、CORBA 進行遠端調用;而另一類則無須浏覽器安裝任何插件、基于 HTTP 長連接配接。

将“伺服器推”應用在 Web 程式中,首先考慮的是如何在功能有限的浏覽器端接收、處理資訊:

1] 用戶端如何接收、處理資訊,是否需要使用套接口或是使用遠端調用。用戶端呈現給使用者的是 HTML 頁面還是 Java applet 或 Flash 視窗。如果使用套接口和遠端調用,怎麼和 JavaScript 結合修改 HTML 的顯示。

2] 客戶與伺服器端通信的資訊格式,采取怎樣的出錯處理機制。

3] 用戶端是否需要支援不同類型的浏覽器如 IE、Firefox,是否需要同時支援 Windows 和 Linux 平台。

來看看更傳統的基于用戶端套接口的“伺服器推”技術

1)Flash XMLSocket

如果 Web 應用的使用者接受應用隻有在安裝了 Flash 播放器才能正常運作, 那麼使用 Flash 的 XMLSocket 也是一個可行的方案。

這種方案實作的基礎是:

1] Flash 提供了 XMLSocket 類。

2] JavaScript 和 Flash 的緊密結合:在 JavaScript 可以直接調用 Flash 程式提供的接口。

具體實作方法:在 HTML 頁面中内嵌入一個使用了 XMLSocket 類的 Flash 程式。JavaScript 通過調用此 Flash 程式提供的套接口接口與伺服器端的套接口進行通信。JavaScript 在收到伺服器端以 XML 格式傳送的資訊後可以很容易地控制 HTML 頁面的内容顯示。

關于如何去建構充當了 JavaScript 與 Flash XMLSocket 橋梁的 Flash 程式,以及如何在 JavaScript 裡調用 Flash 提供的接口,我們可以參考 AFLAX(Asynchronous Flash and XML)項目提供的 Socket Demo 以及 SocketJS(請參見 參考資源)。

Javascript 與 Flash 的緊密結合,極大增強了用戶端的處理能力。從 Flash 播放器 V7.0.19 開始,已經取消了 XMLSocket 的端口必須大于 1023 的限制。Linux 平台也支援 Flash XMLSocket 方案。但此方案的缺點在于:

1] 用戶端必須安裝 Flash 播放器;

2] 因為 XMLSocket 沒有 HTTP 隧道功能,XMLSocket 類不能自動穿過防火牆;

3] 因為是使用套接口,需要設定一個通信端口,防火牆、代理伺服器也可能對非 HTTP 通道端口進行限制。

不過這種方案在一些網絡聊天室,網絡互動遊戲中已得到廣泛使用。

2)Java Applet 套接口

在用戶端使用 Java Applet,通過 java.net.Socket 或 java.net.DatagramSocket 或 java.net.MulticastSocket 建立與伺服器端的套接口連接配接,進而實作“伺服器推”。

這種方案最大的不足在于 Java applet 在收到伺服器端傳回的資訊後,無法通過 JavaScript 去更新 HTML 頁面的内容。

基于 HTTP 長連接配接的“伺服器推”技術:Comet技術

1)Comet 簡介

浏覽器作為 Web 應用的前台,自身的處理功能比較有限。浏覽器的發展需要用戶端更新軟體,同時由于用戶端浏覽器軟體的多樣性,在某種意義上,也影響了浏覽器新技術的推廣。在 Web 應用中,浏覽器的主要工作是發送請求、解析伺服器傳回的資訊以不同的風格顯示。AJAX 是浏覽器技術發展的成果,通過在浏覽器端發送異步請求,提高了單使用者操作的響應性。但 Web 本質上是一個多使用者的系統,對任何使用者來說,可以認為伺服器是另外一個使用者。現有 AJAX 技術的發展并不能解決在一個多使用者的 Web 應用中,将更新的資訊實時傳送給用戶端,進而使用者可能在“過時”的資訊下進行操作。而 AJAX 的應用又使背景資料更新更加頻繁成為可能。

圖 1. 傳統的 Web 應用模型與基于 AJAX 的模型之比較:

“伺服器推”是一種很早就存在的技術,以前在實作上主要是通過用戶端的套接口,或是伺服器端的遠端調用。因為浏覽器技術的發展比較緩慢,沒有為“伺服器推”的實作提供很好的支援,在純浏覽器的應用中很難有一個完善的方案去實作“伺服器推”并用于商業程式。最近幾年,因為 AJAX 技術的普及,以及把 IFrame 嵌在“htmlfile“的 ActiveX 元件中可以解決 IE 的加載顯示問題,一些受歡迎的應用如 meebo,gmail+gtalk 在實作中使用了這些新技術;同時“伺服器推”在現實應用中确實存在很多需求。因為這些原因,基于純浏覽器的“伺服器推”技術開始受到較多關注,Alex Russell(Dojo Toolkit 的項目 Lead)稱這種基于 HTTP 長連接配接、無須在浏覽器端安裝插件的“伺服器推”技術為“Comet”。目前已經出現了一些成熟的 Comet 應用以及各種開源架構;一些 Web 伺服器如 Jetty 也在為支援大量并發的長連接配接進行了很多改進。關于 Comet 技術最新的發展狀況請參考關于

Comet 的 wiki

下面将介紹兩種 Comet 應用的實作模型。

2)Comet技術實作模型1:基于 AJAX 的長輪詢(long-polling)方式

如 圖 1 所示,AJAX 的出現使得 JavaScript 可以調用 XMLHttpRequest 對象發出 HTTP 請求,JavaScript 響應處理函數根據伺服器傳回的資訊對 HTML 頁面的顯示進行更新。使用 AJAX 實作“伺服器推”與傳統的 AJAX 應用不同之處在于:

伺服器端會阻塞請求直到有資料傳遞或逾時才傳回。

用戶端 JavaScript 響應處理函數會在處理完伺服器傳回的資訊後,再次送出請求,重建立立連接配接。

當用戶端處理接收的資料、重建立立連接配接時,伺服器端可能有新的資料到達;這些資訊會被伺服器端儲存直到用戶端重建立立連接配接,用戶端會一次把目前伺服器端所有的資訊取回。

圖 2. 基于長輪詢的伺服器推模型:

一些應用及示例如 “Meebo”, “Pushlet Chat” 都采用了這種長輪詢的方式。相對于“輪詢”(poll),這種長輪詢方式也可以稱為“拉”(pull)。因為這種方案基于 AJAX,具有以下一些優點:請求異步發出;無須安裝插件;IE、Mozilla FireFox 都支援 AJAX。

在這種長輪詢方式下,用戶端是在 XMLHttpRequest 的 readystate 為 4(即資料傳輸結束)時調用回調函數,進行資訊處理。當 readystate 為 4 時,資料傳輸結束,連接配接已經關閉。Mozilla Firefox 提供了對 Streaming AJAX 的支援, 即 readystate 為 3 時(資料仍在傳輸中),用戶端可以讀取資料,進而無須關閉連接配接,就能讀取處理伺服器端傳回的資訊。IE 在 readystate 為 3 時,不能讀取伺服器傳回的資料,目前 IE 不支援基于 Streaming AJAX。

3)Comet技術實作模型2:基于 Iframe 及 htmlfile 的流(streaming)方式

上節提到的 AJAX 方案是在 JavaScript 裡處理 XMLHttpRequest 從伺服器取回的資料,然後 Javascript 可以很友善的去控制 HTML 頁面的顯示。同樣的思路用在 iframe 方案的用戶端,iframe 伺服器端并不傳回直接顯示在頁面的資料,而是傳回對用戶端 Javascript 函數的調用,如“js_func(“data from server ”)”。伺服器端将傳回的資料作為用戶端 JavaScript 函數的參數傳遞;用戶端浏覽器的 Javascript 引擎在收到伺服器傳回的 JavaScript 調用時就會去執行代碼。

從 圖 3 可以看到,每次資料傳送不會關閉連接配接,連接配接隻會在通信出現錯誤時,或是連接配接重建時關閉(一些防火牆常被設定為丢棄過長的連接配接, 伺服器端可以設定一個逾時時間, 逾時後通知用戶端重建立立連接配接,并關閉原來的連接配接)。

使用 iframe 請求一個長連接配接有一個很明顯的不足之處:IE、Morzilla Firefox 下端的進度欄都會顯示加載沒有完成,而且 IE 上方的圖示會不停的轉動,表示加載正在進行。Google 的天才們使用一個稱為“htmlfile”的 ActiveX 解決了在 IE 中的加載顯示問題,并将這種方法用到了 gmail+gtalk 産品中。Alex Russell 在 “What else is burried down in the depth's of Google's amazing JavaScript?”文章中介紹了這種方法。Zeitoun 網站提供的 comet-iframe.tar.gz,封裝了一個基于 iframe 和 htmlfile 的 JavaScript comet 對象,支援 IE、Mozilla Firefox 浏覽器,可以作為參考。

使用 Comet 模型開發自己的應用

上面介紹了兩種基于 HTTP 長連接配接的“伺服器推”架構,更多描述了用戶端處理長連接配接的技術。對于一個實際的應用而言,系統的穩定性和性能是非常重要的。将 HTTP 長連接配接用于實際應用,很多細節需要考慮。

1)不要在同一用戶端同時使用超過兩個的 HTTP 長連接配接

我們使用 IE 下載下傳檔案時會有這樣的體驗,從同一個 Web 伺服器下載下傳檔案,最多隻能有兩個檔案同時被下載下傳。第三個檔案的下載下傳會被阻塞,直到前面下載下傳的檔案下載下傳完畢。這是因為 HTTP 1.1 規範中規定,用戶端不應該與伺服器端建立超過兩個的 HTTP 連接配接, 新的連接配接會被阻塞。而 IE 在實作中嚴格遵守了這種規定。

HTTP 1.1 對兩個長連接配接的限制,會對使用了長連接配接的 Web 應用帶來如下現象:在用戶端如果打開超過兩個的 IE 視窗去通路同一個使用了長連接配接的 Web 伺服器,第三個 IE 視窗的 HTTP 請求被前兩個視窗的長連接配接阻塞。

是以在開發長連接配接的應用時, 必須注意在使用了多個 frame 的頁面中,不要為每個 frame 的頁面都建立一個 HTTP 長連接配接,這樣會阻塞其它的 HTTP 請求,在設計上考慮讓多個 frame 的更新共用一個長連接配接。

2)伺服器端的性能和可擴充性

一般 Web 伺服器會為每個連接配接建立一個線程,如果在大型的商業應用中使用 Comet,伺服器端需要維護大量并發的長連接配接。在這種應用背景下,伺服器端需要考慮負載均衡和叢集技術;或是在伺服器端為長連接配接作一些改進。

應用和技術的發展總是帶來新的需求,進而推動新技術的發展。HTTP 1.1 與 1.0 規範有一個很大的不同:1.0 規範下伺服器在處理完每個 Get/Post 請求後會關閉套接口連接配接; 而 1.1 規範下伺服器會保持這個連接配接,在處理兩個請求的間隔時間裡,這個連接配接處于空閑狀态。 Java 1.4 引入了支援異步 IO 的 java.nio 包。當連接配接處于空閑時,為這個連接配接配置設定的線程資源會返還到線程池,可以供新的連接配接使用;當原來處于空閑的連接配接的客戶發出新的請求,會從線程池裡配置設定一個線程資源處理這個請求。 這種技術在連接配接處于空閑的機率較高、并發連接配接數目很多的場景下對于降低伺服器的資源負載非常有效。

但是 AJAX 的應用使請求的出現變得頻繁,而 Comet 則會長時間占用一個連接配接,上述的伺服器模型在新的應用背景下會變得非常低效,線程池裡有限的線程數甚至可能會阻塞新的連接配接。Jetty 6 Web 伺服器針對 AJAX、Comet 應用的特點進行了很多創新的改進,請參考文章“AJAX,Comet and Jetty”。

3)控制資訊與資料資訊使用不同的 HTTP 連接配接

使用長連接配接時,存在一個很常見的場景:用戶端網頁需要關閉,而伺服器端還處在讀取資料的堵塞狀态,用戶端需要及時通知伺服器端關閉資料連接配接。伺服器在收到關閉請求後首先要從讀取資料的阻塞狀态喚醒,然後釋放為這個用戶端配置設定的資源,再關閉連接配接。

是以在設計上,我們需要使用戶端的控制請求和資料請求使用不同的 HTTP 連接配接,才能使控制請求不會被阻塞。

在實作上,如果是基于 iframe 流方式的長連接配接,用戶端頁面需要使用兩個 iframe,一個是控制幀,用于往伺服器端發送控制請求,控制請求能很快收到響應,不會被堵塞;一個是顯示幀,用于往伺服器端發送長連接配接請求。如果是基于 AJAX 的長輪詢方式,用戶端可以異步地發出一個 XMLHttpRequest 請求,通知伺服器端關閉資料連接配接。

4)在客戶和伺服器之間保持“心跳”資訊

在浏覽器與伺服器之間維持一個長連接配接會為通信帶來一些不确定性:因為資料傳輸是随機的,用戶端不知道何時伺服器才有資料傳送。伺服器端需要確定當用戶端不再工作時,釋放為這個用戶端配置設定的資源,防止記憶體洩漏。是以需要一種機制使雙方知道大家都在正常運作。在實作上:

伺服器端在阻塞讀時會設定一個時限,逾時後阻塞讀調用會傳回,同時發給用戶端沒有新資料到達的心跳資訊。此時如果用戶端已經關閉,伺服器往通道寫資料會出現異常,伺服器端就會及時釋放為這個用戶端配置設定的資源。

如果用戶端使用的是基于 AJAX 的長輪詢方式;伺服器端傳回資料、關閉連接配接後,經過某個時限沒有收到用戶端的再次請求,會認為用戶端不能正常工作,會釋放為這個用戶端配置設定、維護的資源。

當伺服器處理資訊出現異常情況,需要發送錯誤資訊通知用戶端,同時釋放資源、關閉連接配接。

Comet開源工程推薦

Pushlet:

Pushlet 是一個開源的 Comet 架構,在設計上有很多值得借鑒的地方,對于開發輕量級的 Comet 應用很有參考價值。使用了觀察者模型。浏覽器端提供了基于 AJAX 和 iframe 的 JavaScript 庫,伺服器端使用 Java Servlet。位址是:

http://www.pushlets.com/?cm_mc_uid=72410021035714633836363&cm_mc_sid_50200000=1464236784 iComet:

iComet 是一個使用 C++ 語言開發的支援百萬并發連接配接的 comet/push 伺服器, 支援百萬級并發連接配接, 記憶體占用少, 性能優越. 可用于移動 App 的 Push Server(消息推送伺服器), 或者用于 Web Push(Web 伺服器推). 用于 Web Push 時, 支援的浏覽器和作業系統平台包括: Safari(iOS, Mac), Firefox/Chrome(Windows, Mac), IE6+。詳細請參見:

http://www.52im.net/thread-330-1-1.html

系列文章

�Web端即時通訊新手入門: 新手入門:詳解Web端即時通訊技術的原理 �Web端即時通訊技術盤點請參見: 關于Ajax短輪詢: 找這方面的資料沒什麼意義,除非忽悠客戶,否則請考慮其它3種方案即可。 有關Comet技術�的詳細介紹請參見: Comet技術詳解:基于HTTP長連接配接的Web端實時通信技術 WEB端即時通訊:HTTP長連接配接、長輪詢(long polling)詳解 WEB端即時通訊:不用WebSocket也一樣能搞定消息的即時性 開源Comet伺服器iComet:支援百萬并發的Web端即時通訊�方案 有關WebSocket的詳細介紹請參見: WebSocket詳解(一):初步認識WebSocket技術 WebSocket詳解(二):技術原理、代碼示範和應用案例 WebSocket詳解(三):深入WebSocket通信協定細節 Socket.IO介紹:支援WebSocket、用于WEB端的即時通訊的架構 socket.io和websocket 之間是什麼關系?有什麼差別? 有關SSE的詳細介紹文章請參見: SSE技術詳解:一種全新的HTML5伺服器推送事件技術 更多WEB端即時通訊文章請見: http://www.52im.net/forum.php?mod=collection&action=view&ctid=15

(本文同步釋出于:

作者: Jack Jiang (點選作者姓名進入Github) 出處: http://www.52im.net/space-uid-1.html 交流: �歡迎加入即時通訊開發交流群 讨論: http://www.52im.net/ Jack Jiang同時是 【原創Java Swing外觀工程BeautyEye】 【輕量級移動端即時通訊架構MobileIMSDK】 的作者,可前往下載下傳交流。