图解 TCP 的通信机制
本文是参考【图解 TCP/IP】
TCP(Transmission Control Protocol)是传输控制协议,其作用于传输层,是一种提供了面向连接通信服务的协议
看 TCP 的英文全称就知道,其主要作用就是传输 、控制,传输的是数据,控制的是在传输过程中丢包后的重发 、分包乱序后的有序重组 、控制数据传输的速率防止网络拥塞等
这也是我们口中一直说的 TCP 是一种可靠的传输协议的原因。本文就将对 TCP 的作用过程以及一些机制进行讲解
一、TCP 连接管理
TCP 是面向连接进行通信服务的协议,所谓连接,其实就是在两台需要数据交互的主机之间建立一条虚拟的线路,所有的数据交互都是通过这条线路进行的,而 TCP 就负责这整个线路的创建、销毁、维护管理等工作
在建立连接之前,需要做一些准备,为了确保通信两端是否可以进行正常通信,发送端会通过 TCP 的首部发送一个 SYN 包作为建立连接的请求并等待接收端确认应答。如果接收端确认应答并返回一个 ACK 包,则表示接收端同意与发送端进行通信,然后发送端再次发送一个 ACK 包给接收端,表示已收到你的同意通信的消息了,此后两端就可以正常通信了;若接收端没有返回给发送端一个确认应答的 ACK 包,则表示不同意与发送端进行通信,那么两端自然无法进行后续的通信了
两端若在通信完成以后肯定需要断开通信,同样也需要两端互发包来确认是否要断开通信。比如,发送端先发送一个 FIN 包给接收端,告知想要断开连接,然后接收端可以返回给发送端一个 ACK 包表示同意你断开连接的请求,紧接着接收端也向发送端发送了一个 FIN 包,表示其也想断开连接的意愿,发送端在接收到该包后随即返回给接收端一个 ACK 包表示我也同意你断开连接,这样,两端就断开连接了
总结一下,一次完整的 TCP 连接的建立与断开至少需要来回发送 7 个包,其中建立连接需要发 3 个包,断开连接需要发 4 个包
我们来看一下完整的通信过程简图
这就是大家常说的三次握手,四次挥手的过程
如果不好理解上面的建立、断开连接过程,这里我再给大家举一个小小的例子
发送端与接收端通信,就好比我们日常生活中两个人打电话,例如现在 A 给 B 打电话
A 问 B:喂?你是 B 吗?
B 回答 A:我是 B 呀,你是 A 吗?
A 回答 B:对的,我是 A
就这样一个简单的三次对话就确认了双方是想要互相通信的对象,因此连接就此建立了
那么当 A 和 B 聊完天,准备挂电话了
A 对 B 说:我的事说完了,那么没啥事我就挂电话了哈
B 回答 A:好的
B 又对 A 补充了一句:我也没啥事了,那我也挂了哈
A 回答 B:好的
这三段对话就使通信双方确认了会话结束,因此连接就此断开了
二、分段数据发送
TCP 不是拿到一整个包就直接原封不动地传给接收端的,因为若这样做,即使是发生了数据丢失,也不知道到底丢失了哪部分的数据,因此其采用的就是将数据分段发送的方式
这里先说明一点,不光建立和断开连接时接收端需要向发送端发送请求应答,在数据交互时也是需要的
例如有一个数据包,我们可以将其按顺序给每一个字节都标上一个序号,然后我们假设每次发送 1000 个序号区间的数据给接收端,所以第一次发送的是 序号 1 ~ 1000
的数据,接收端接收到了以后会返回给发送端一个请求应答,告知发送端下一次请发送 序号 1001 ~ 2000
的数据过来,过程如图所示
上面我们假设的是每次发送 1000 个序列号区间的单位,而实际过程中,却不一定是这个值。
在前面的学习中,我们得知数据在数据链路层中传输会收到 MTU(最大传输单元)的影响,若数据大于该值,IP 则会被分片处理,因此我们尽可能地不让这种事情发生,那么就要让传输的每段数据大小小于该通信线路上最小的 MTU,该值称为 MSS(最大消息长度)
该值是会在建立连接的三次握手时被计算获得的,比如发送端在请求接收端的时候,在发送的包上附带上其线路上的 MTU 大小为 4000,然后接收端在发送确认应答给发送端时,也会在包上附带上其线路上的 MTU 大小为 1460,此时发送端接收到确认应答后比较两个 MTU 的大小,取其中小的那个值作为之后数据传输每段的数据大小
如图:
三、重发控制
我们都知道,在数据传输过程中可能会因为各种原因出现丢包现象,而当出现丢包现象时,即发送端在发完数据以后等待一段时间,并未收到接收端的确认应答,则视为丢包,于是就会进行重发
其中丢包现象又分为两种:
发送端向接收端发送数据的过程中,发生了丢包现象,接收端并未接收到数据,因此不会给发送端发送确认应答
接收端收到了发送端传过来的数据,并且也向发送端返回了确认应答,但确认应答的包却在发送的途中出现了丢包,所以发送端接收不到确认应答
以上两种情况如下图所示:
第一种情况:
第二种情况:
那么,发送端发送完数据后多久没收到确认应答才判定数据丢包了呢?这个都是随着网络环境的变化而变化的,TCP 会在每次发包时计算往返时间以及偏差来决定等待的时间
若重发后又出现了丢包,则下一次等待的时间会以 2 倍、4 倍的指数函数延长
但其又不会无限进行重发,当重发次数达到一定程度后,会判定为网络异常,两端通信就会被强制关闭
四、滑动窗口控制
上面介绍了 TCP 将数据分段发送,虽然提高了传输的可靠性,但是存在着一个致命的缺点,那就是效率非常低,因为每送一段都要等待接收端的确认应答,若整个数据的分段较多,那么通信的性能可能就会很低了,因此 TCP 引入了窗口这个概念
所谓窗口,表示的是无需等待确认应答而可以连续发送的连续多段数据的区域,如图
我们假设每段数据长度为 1000,这里的窗口大小为 4 段,因此发送端可以将这四段数据都分别发送出去并且不需要发送一段数据以后等待一个确认应答,如图
此时的窗口包含 4 个段,即窗口内包含 4000 个字节的数据,我们称之为窗口大小
接收端在返回相应的确认应答给发送端时,发送端会根据收到的确认应答,继续发送比该确认应答中序列号大 4000 的数据,如图所示
五、滑动窗口的重发控制
若使用了滑动窗口控制这一技术后,即使某段数据出现了丢包现象,也不会造成太大的影响,因为接收端会一边接收发送端传过来的数据,一边用某种方式告知发送端刚才丢失了哪段数据
接下来我们来介绍一下其作用过程,如图所示
图中,在发送第二段数据(1001 ~ 2000)时发生了丢包,因此接收端没有接收到对应的包,所以当发送端传过来第三段数据的时候,接收端返回的仍是第二段的确认应答,紧接着发送端分别发送了第四段、第五段数据,可接收端都返回的是第二段的确认应答
就这样连着三次发送了同一个确认应答给发送端,所以发送端得知刚才传输数据的过程中第二段数据发生了丢包,因此此时会将丢失的数据重发一份
然后接收端在接收到之前丢掉的那段数据以后,因为之前的数据都成功接收了,所以下一次就开始请求 5001 ~ 6000 这段数据了
六、流控制
有时,发送端发送给接收端的数据超过了接收端的最大承载能力,因此会造成数据无法接收的情况,从而导致之后会进行数据重发,这非常得浪费性能。
为了防止上述情况得发生,TCP 提供了一种机制可以使发送端每次发送的数据尽可能得在接收端得承载能力之内,而其实现得方式就是接收端向发送端告知自己能够接收的数据大小,因此发送端每次发送的数据就都不会超过该值,我们称该值为窗口大小
一旦接收端暂时无法接收任何数据,它会告知发送端,因此发送端会暂停数据的发送,但为了后续数据的正常发送,发送端会不时地向接收端发送一个窗口探测,试探性地看一下接收端是否能继续接收数据了
具体的过程如下图所示
七、拥塞控制
因为出现了窗口控制,数据不再是一段一段发送,而是连续发送多段数据包,因此有时如果遇到网络拥堵的情况,而我们又同时发送了大量的数据包,可能会导致网络瘫痪
TCP 运用了一种叫做慢启动技巧缓解了上述情况,何为慢启动呢?就是不要在一开始就瞬间发送大量数据包,而是先发送一部分,然后根据收发情况再发送更多的数据包
具体过程我们来看一下
如图中,发送端的窗口大小为 1000,因此只发送了一段长度为 1000 字节的数据包,此时接收端收到数据并返回一个确认应答,因此发送端将窗口大小加一,即窗口大小为 2000 ;发送端又发送了两段长度为 1000 的数据包,接收端收到数据并返回两个确认应答,因此发送端将窗口大小加二,即窗口大小为 4000 ;以此类推
总结: 发送端每次发送的数据包会以 1,2,4 的指数型增长
但窗口大小也不会无限指数型增大,而是会在达到某个值时进行一些调整,该值称为慢启动阈值
八、结束语
我是「零一」, 不定时更新前端面试题,与我一起学习前端,早日斩获大厂 Offer
版权声明: 本文为 InfoQ 作者【零一】的原创文章。
原文链接:【http://xie.infoq.cn/article/ed837a5a134c78f36df18b322】。文章转载请联系作者。
评论