“TCP是一種流模式的協定,UDP是一種資料報模式的協定”,這句話相信大家對這句話已經耳熟能詳~但是,“流模式”與“資料包模式”在程式設計的時候有什麼差別呢?以下是我的了解,僅供參考!
1、TCP
打個比方比喻TCP,你家裡有個蓄水池,你可以裡面倒水,蓄水池上有個龍頭,你可以通過龍頭将水池裡的水放出來,然後用各種各樣的容器裝(杯子、礦泉水瓶、鍋碗瓢盆)接水。
上面的例子中,往水池裡倒幾次水和接幾次水是沒有必然聯系的,也就是說你可以隻倒一次水,然後分10次接完。另外,水池裡的水接多少就會少多少;往裡面倒多少水,就會增加多少水,但是不能超過水池的容量,多出的水會溢出。
結合TCP的概念,水池就好比接收緩存,倒水就相當于發送資料,接水就相當于讀取資料。好比你通過TCP連接配接給另一端發送資料,你隻調用了一次write,發送了100個位元組,但是對方可以分10次收完,每次10個位元組;你也可以調用10次write,每次10個位元組,但是對方可以一次就收完。(假設資料都能到達)但是,你發送的資料量不能大于對方的接收緩存(流量控制),如果你硬是要發送過量資料,則對方的緩存滿了就會把多出的資料丢棄。
這種情況是設定非阻塞I/O模型,會把記憶體耗盡,因為socket是存在核心中的。
2、UDP
UDP和TCP不同,發送端調用了幾次write,接收端必須用相同次數的read讀完。UPD是基于封包的,在接收的時候,每次最多隻能讀取一個封包,封包和封包是不會合并的,如果緩沖區小于封包長度,則多出的部分會被丢棄。也就說,如果不指定MSG_PEEK标志,每次讀取操作将消耗一個封包。
3、為什麼
其實,這種不同是由TCP和UDP的特性決定的。TCP是面向連接配接的,也就是說,在連接配接持續的過程中,socket中收到的資料都是由同一台主機發出的(劫持什麼的不考慮),是以,知道保證資料是有序的到達就行了,至于每次讀取多少資料自己看着辦。
而UDP是無連接配接的協定,也就是說,隻要知道接收端的IP和端口,且網絡是可達的,任何主機都可以向接收端發送資料。這時候,如果一次能讀取超過一個封包的資料,則會亂套。比如,主機A向發送了封包P1,主機B發送了封包P2,如果能夠讀取超過一個封包的資料,那麼就會将P1和P2的資料合并在了一起,這樣的資料是沒有意義的。
幀(frame)是一種資訊機關,它的起始點和目的點都是資料鍊路層。
資料包(packet)也是一種資訊機關,它的起始和目的地是網絡層。
資料報(datagram)通常是指起始點和目的地都使用無連接配接網絡服務的的網絡層的資訊單元。
段(segment)通常是指起始點和目的地都是傳輸層的資訊單元。
消息(message)是指起始點和目的地都在網絡層以上(經常在應用層)的資訊單元。
元素(cell)是一種固定長度的資訊,它的起始點和目的地都是資料鍊路層。元素通常用于異步傳輸模式(ATM)和交換多兆位資料服務(SMDS)網絡等交換環境。
資料單元(dataunit)指許多資訊單元。常用的資料單元有服務資料單元(SDU)、協定資料單元(PDU)。SDU是在同一機器上的兩層之間傳送資訊。PDU是發送機器上每層的資訊發送到接收機器上的相應層(同等層間交流用的)。
昨天晚上看了chinaitlab的那個ccna的錄象,講到了流、幀、包、位的差別,看了還是不怎麼太懂,今天用baidu搜尋了一下,看到了一個比較不錯的解釋,我把他copy到這裡:
資料幀(Frame):是一種資訊機關,它的起始點和目的點都是資料鍊路層。
資料包(Packet):也是一種資訊機關,它的起始和目的地是網絡層。
資料報(Datagram):通常是指起始點和目的地都使用無連接配接網絡服務的的網絡層的資訊單元。
段(Segment):通常是指起始點和目的地都是傳輸層的資訊單元。
資料鍊路層的PDU叫做Frame(幀);
網絡層的PDU叫做Packet(資料包);
TCP的叫做Segment(資料段);
看了這個解釋呢,就比較不錯了,還有個比較不太清楚的東西就是流,那麼流又是一個什麼樣的概念呢?看到關于封裝和解封裝的部分的時候,提到了分裝是做了2個動作,一個切片,一個是加如控制資訊,那麼這個經過了切片後的那個東西叫什麼呢?如果您看到文章,懇請您幫我解釋一下,謝謝!
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
用戶端發送位元組流時,TCP會保證服務端按順序接收到全部的位元組流,其他諸如資料包的大小等,TCP協定對我們來說是透明的,我們可以全部不考慮。
通俗點說,我們發送資料隻需要調用send函數,我們隻需要關注send函數的傳回值,進而知道了發送了多少個位元組,在服務端,我們調用recv函數,我們隻需要關注recv函數的傳回值,進而知道接收了多少個位元組,其他情況通通不管。
在TCP通信過程中,我們不需要關心(也沒法關心,但可以設定)資料包的大小,個數,我們隻需要在用戶端建立一個緩沖區不斷發送,在服務端建立一個緩沖區不斷接收就夠了,當然,我們還可以定義一個標頭,來實作諸如發送檔案這樣更強大的功能。
這就是TCP通信的本質,不會應平台的不同而改變。
流式套接字要分客戶和伺服器,而資料報不用分
流式套接字适合傳輸資料量大的,而資料報套接字适合傳遞資料量少的
流式套接字建立麻煩,資料報套接字建立簡單
客戶的流式套接字隻能向一個方向傳遞,資料報套接字可以接受任何方向的來得資料,并可以向任何位址發送資料報
流套接字比資料報套接字好,這樣你可以不必管理底層細節,隻需要相信TCP就可以保證傳送的資料是依次,可靠的傳送的,缺點是效率相對資料報套接字低。
使用資料報套接字,可以讓你更快,但你得自已保證資料是否依次,準确的傳送來的,
如使用資料報套接字,你可能先收到後發的,後收到先發的,還有可能收漏,
資料報套接字是用來發送資料報的,是面向無連接配接不可靠的傳輸(在今天這個網絡裡,其實已經相當可靠)
流套接字是面向連接配接可靠的傳輸。伺服器通過轉發實作一個客戶與另一個客戶的資料傳送。當向另一個客戶轉發時,他必須知道對方IP(或套接字等),是以要求轉發的客戶必須提供關于接受方的資訊,否則伺服器不知道向哪轉發。