目录
1. 应用层
2. 传输层
2.1 UDP协议
2.1.1 UDP的特点
2.2 TCP协议
3. TCP协议的主要机制
3.1 确认应答(ACK)机制
3.2 超时重传机制
3.3 连接管理机制
3.4 TCP协议中的状态
3.5 滑动窗口机制
3.6 流量控制
3.7 拥塞控制
3.8 延迟应答
3.9 捎带应答
3.10 面向字节流
3.11 粘包问题
3.12 TCP异常情况
1. 应用层
2. 传输层
(传输层和网络层是操作系统内核实现好的.普通程序猿不能修改)
核心功能:完成"端对端"的数据传输
传输层协议有很多~~最常用的有两个:UDP/TCP
2.1 UDP协议
UDP协议端格式:
16位UDP长度, 表示整个数据报(UDP首部+UDP数据)的最大长度
如果校验和出错, 就会直接丢弃
2.1.1 UDP的特点
a)无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接
b)不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不 会给应用层返回任何错误信息
c)面向数据报: 不能够灵活的控制读写数据的次数和数量
面向数据报
应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并;
用UDP传输100个字节的数据: 如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接 收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节
UDP的缓冲区
UDP没有真正意义上的发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作
UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃
UDP的socket既能读, 也能写, 这个概念叫做 全双工
UDP使用注意事项
我们注意到, UDP协议首部中有一个16位的最大长度. 也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部). 然而64K在当今的互联网环境下, 是一个非常小的数字. 如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装
2.2 TCP协议
TCP全称为 "传输控制协议(Transmission Control Protocol"). 人如其名, 要对数据的传输进行一个详细的控制
TCP协议段格式:
4位TCP报头长度:
表示该TCP头部有多少个32位bit(有多少个4字节); 所以TCP头部最大长度是15 * 4 = 60
6位标志位:
URG: 紧急指针是否有效
ACK: 确认号是否有效
PSH: 提示接收端应用程序立刻从TCP缓冲区把数据读走
RST: 对方要求重新建立连接; 我们把携带RST标识的称为复位报文段
SYN: 请求建立连接; 我们把携带SYN标识的称为同步报文段
FIN: 通知对方, 本端要关闭了, 我们称携带FIN标识的为结束报文段
16位校验和:
发送端填充, CRC校验. 接收端校验不通过, 则认为数据有问题. 此处的检验和不光包含 TCP首部, 也包含TCP数据部分
16位紧急指针:
标识哪部分数据是紧急数据
3. TCP协议的主要机制
3.1 确认应答(ACK)机制
TCP将每个字节的数据都进行了编号. 即为序列号
每一个ACK都带有对应的确认序列号, 意思是告诉发送者, 我已经收到了哪些数据; 下一次你从哪里开始发
确认序号在TCP中是有特定含义的~
表示接下来想要的下一条数据编号是啥.而不是收到的数据编号是啥~
(这样的设定是非常有用的)
发送方收到应答数据的时候.应答报文中的确认序号为1001,此时发送方就知道了, 1-1000的数据已经顺利抵达.并且接下来要发送的数据就是从1001开始~
3.2 超时重传机制
若回应丢包,那么发送方就会继续发送数据,会造成数据重复
TCP自身已经处理好了这种数据重复的情况
1. TCP有一一个"接受缓冲区" (一块内存)
TCP就会检查缓冲区中有没有重复的数据~根据序号就能去重
2. 超时重传等待的时间间隔,不是固定的,而是逐渐变大的
假设丢包的概率是固定值,此时连续丢包的概率其实是比较小的
一旦真的出现连续丢包,大概率是网络出现了彻底的问题(网线断开)因此, TCP重传的时间间 隔,就会越来越高~频率就会越来越低
重传到一定的次数就会尝试断开连接~
Linux中(BSD Unix和Windows也是如此), 超时以500ms为一个单位进行控制, 每次判定超时 重发的超时时间都是500ms的整数倍
如果重发一次之后, 仍然得不到应答, 等待 2*500ms 后再进行重传
如果仍然得不到应答, 等待 4*500ms 进行重传. 依次类推, 以指数形式递增
累计到一定的重传次数, TCP认为网络或者对端主机出现异常, 强制关闭连接
3.3 连接管理机制
在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接
三次握手:
三次握手的本质,其实是确认通信双方,发送能力和接受能力都正常
举例理解:
真实情况 :
四次挥手:
断开连接时,主机B给主机A回复的FIN和ACK能否合并在一起呢?
不一定~~可能能合并,也可能不会合并
不会合并的理由是发送ACK和FIN的时机是不一样的.发送ACK是操作系统内核的行为.在收到FIN的第一时间,回复ACK,发送FIN是应用程序的行为.在代码中执行到对应的"close()" 才会触发FIN
会合并的理由是如果close能够很快被调用到,(FIN和ACK的时间间隔不是很长的时候就会触发TCP的"延时应答+捎带应答"机制~~)
其实在三次握手和四次挥手之间也会涉及到"确认应答和超时重传"
3.4 TCP协议中的状态
TCP协议是有“状态”,重点理解TCP中的一些核心的状态
1. ESTABLISHED连接成功,可以进行后续通信了.好比打电话,拨号拨通了一样~
2. LISTEN服务器端进入的状态.服务器准备就绪,允许客户端随时来建立连接~~好比手机开机信号良好,随时可以有人来打电话~
3. CLOSE_ WAIT可以理解成一个断开连接时的中间状态.这个状态正常情况下存在时间较短.出现在,收到FIN,返回ACK,到发送FIN这个时间间隙中.一般看到这个状态的时候,多半是代码出bug了,导致没有及时调用到close方法~~
4. TIME_ WAIT也是断开连接时的状态~
3.5 滑动窗口机制
确认应答策略, 对每一个发送的数据段, 都要给一个ACK确认应答. 收到ACK后再发送下一 个数据段. 这样做有一个比较大的缺点, 就是性能较差. 尤其是数据往返的时间较长的时候
既然这样一发一收的方式性能较低, 那么我们一次发送多条数据, 就可以大大的提高性能(其实是将多个段 的等待时间重叠在一起了)
a)窗口大小指的是无需等待确认应答而可以继续发送数据的最大值. 上图的窗口大小就是4000 个字节(四个段)
b)发送前四个段的时候, 不需要等待任何ACK, 直接发送
c)收到第一个ACK后, 滑动窗口向后移动, 继续发送第五个段的数据; 依次类推
d)操作系统内核为了维护这个滑动窗口, 需要开辟 发送缓冲区 来记录当前还有哪些数据没有应 答; 只有确认应答过的数据 比特科技 , 才能从缓冲区删掉
e)窗口越大, 则网络的吞吐率就越高;
窗口范围内的数据就是已经发出去的数据,同时也是要等待ACK的数据.随着对方的ACK的到达,要等待的数据也就随之发送变化.同时也会发送新的数据出去
看起来就好像"窗口滑了一个格子一样"
那么如果出现了丢包, 如何进行重传? 这里分两种情况讨论
情况一: 数据包已经抵达, ACK被丢了
这种情况下, 部分ACK丢了并不要紧, 因为可以通过后续的ACK进行确认
情况二: 数据包就直接丢了
当某一段报文段丢失之后, 发送端会一直收到 1001 这样的ACK, 就像是在提醒发送端 "我想要 的是 1001" 一样
如果发送端主机连续三次收到了同样一个 "1001" 这样的应答, 就会将对应的数据 1001 - 2000 重新发送
这个时候接收端收到了 1001 之后, 再次返回的ACK就是7001了(因为2001 - 7000)接收端其实 之前就已经收到了, 被放到了接收端操作系统内核的接收缓冲区中
如果连续两个包都丢了呢?
这里的重传机制,是比较精妙的~~得益于确认序号的设计
保证了传输的效率是比较高的
重传的效率也是比较高的(没有重传多余的数据)
这种机制被称为 "高速重发控制"(也叫 "快重传")
限制的方法就是流量控制
3.6 流量控制
接收端处理数据的速度是有限的. 如果发送端发的太快, 导致接收端的缓冲区被打满, 这个时候如果发送端 继续发送, 就会造成丢包, 继而引起丢包重传等等一系列连锁反应
因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫做流量控制(Flow Control)
a)接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段, 通过ACK端通知发 送端
b)窗口大小字段越大, 说明网络的吞吐量越高
c)接收端一旦发现自己的缓冲区快满了, 就会将窗口大小设置成一个更小的值通知给发送端
d)发送端接受到这个窗口之后, 就会减慢自己的发送速度
e)如果接收端缓冲区满了, 就会将窗口置为0; 这时发送方不再发送数据, 但是需要定期发送一个 窗口探测数据段, 使接收端把窗口大小告诉发送端
流量控制的目的是为了让发送方的速率和接收方的速率尽可能一致
步调一致,才能做到可靠的同时尽量高效
在ACK报文中,告诉发送方,接收方的接受缓冲区的空闲空间
根据这个大小,发送方来决定接下来按照多大的窗口来传输速度~
3.7 拥塞控制
滑动窗口的大小由拥塞控制+流量控制. 一起决定的
虽然TCP有了滑动窗口这个大杀器, 能够高效可靠的发送大量的数据. 但是如果在刚开始阶段就发送大量 的数据, 仍然可能引发问题
由于网络环境比较复杂,也不知道中间经历了多少节点~~
所以发送方会采取一个动态变化的过程,来试探出当前的窗口大小多少合适
发送方会在初始情况下,设置一个比较小的 "窗口大小" (慢开始)发一下数据试试,如果没丢包~,说明网络畅通.就开始尝试一个更大的窗口大小~ ,如果还没丢包,网络还是畅通,继续尝试一个更大的窗口大小~~直到出现丢包了,缩小窗口大小循环上述过程~~
滑动窗口的实际大小,就是拥塞窗口和流量控制窗口的较小值
拥塞窗口增长速度, 是指数级别的. "慢启动" 只是指初使时慢, 但是增长速度非常快
为了不增长的那么快, 因此不能使拥塞窗口单纯的加倍. 此处引入一个叫做慢启动的阈值
当拥塞窗口超过这个阈值的时候, 不再按照指数方式增长, 而是按照线性方式增长
3.8 延迟应答
如果接收数据的主机立刻返回ACK应答, 这时候返回的窗口可能比较小
a)假设接收端缓冲区为1M. 一次收到了500K的数据; 如果立刻应答, 返回的窗口就是500K
但实际上可能处理端处理的速度很快, 10ms之内就把500K数据从缓冲区消费掉了
b)在这种情况下, 接收端处理还远没有达到自己的极限, 即使窗口再放大一些, 也能处理过来
如果接收端稍微等一会再应答, 比如等待200ms再应答, 那么这个时候返回的窗口大小就是 1M
一定要记得, 窗口越大, 网络吞吐量就越大, 传输效率就越高. 我们的目标是在保证网络不拥塞的情况下尽量提高传输效率
那么所有的包都可以延迟应答么? 肯定也不是
数量限制: 每隔N个包就应答一次
时间限制: 超过最大延迟时间就应答一次
具体的数量和超时时间, 依操作系统不同也有差异; 一般N取2, 超时时间取200ms
3.9 捎带应答
在延迟应答的基础上, 我们发现, 很多情况下, 客户端服务器在应用层也是 "一发一收" 的. 意味着客户端给 服务器说了 "How are you", 服务器也会给客户端回一个 "Fine, thank you"
那么这个时候ACK就可以搭顺风车 , 和服务器回应的 "Fine, thank you" 一起回给客户端
在一次一问一答中,需要四次TCP数据的交互
一问+ACK
一答+ ACK
应用程序返回响应的时候顺带把上个ACK数据也一起携带过去
减少了传输的数据包的个数,减低了通信成本,提高了效率~
3.10 面向字节流
把TCP传输的数据(应用层数据包)想象成"水流一样"
应用程序可以以字节为单位来读取/发送数据~
核心就是在于TCP的"缓冲区”
3.11 粘包问题
首先要明确, 粘包问题中的 "包" , 是指的应用层的数据包
在TCP的协议头中, 没有如同UDP一样的 "报文长度" 这样的字段, 但是有一个序号这样的字段
站在传输层的角度, TCP是一个一个报文过来的. 按照序号排好序放在缓冲区中
站在应用层的角度, 看到的只是一串连续的字节数据
那么应用程序看到了这么一连串的字节数据, 就不知道从哪个部分开始到哪个部分, 是一个完 整的应用层数据包
UDP不会粘包
那么如何避免粘包问题呢?
归根结底就是一句话, 明确两个包之间的边界
3.12 TCP异常情况
进程终止: 进程终止会释放文件描述符, 仍然可以发送FIN. 和正常关闭没有什么区别
机器重启: 和进程终止的情况相同
机器掉电/网线断开: 接收端认为连接还在, 一旦接收端有写入操作, 接收端发现连接已经不在了, 就会进行 reset. 即使没有写入操作, TCP自己也内置了一个保活定时器, 会定期询问对方是否还在. 如果对方不在, 也会把连接释放