📖 "四报文挥手"释放 TCP 连接
🎯 课程摘要:本节课详细讲解"四报文挥手"释放 TCP 连接的完整过程(FIN → ACK → FIN → ACK),阐述半关闭状态、各状态的序号与确认号变化,重点解释 TIME_WAIT 状态为何要等待 2MSL(确保服务器收到最终确认 + 使旧报文从网络消失),并介绍保活计时器的作用,最后通过 408 考研真题综合考查三报文握手与四报文挥手的序号计算。
📝 详细笔记
1. 释放连接的基本概念
- TCP 通信双方都可以释放 TCP 连接,将释放连接的过程比喻为"挥手",需要在 TCP 客户和服务器之间交换四个 TCP 报文段。
- 假设使用 TCP 客户进程的应用进程通知其主动关闭 TCP 连接(由客户主动发起,故客户为主动关闭方,服务器为被动关闭方)。
2. 四报文挥手完整过程
四个报文段详解
| 报文 | 方向 | 标志位 | seq | ack | 状态变化 | 说明 |
|---|---|---|---|---|---|---|
| ① 连接释放报文段 | 客户 → 服务器 | FIN=1, ACK=1 | u | v | 客户进入终止等待一(FIN-WAIT-1) | u = 客户已传送数据末字节序号 + 1;v = 客户已收数据末字节序号 + 1;FIN=1 即使不携带数据也消耗一个序号 |
| ② 普通确认报文段 | 服务器 → 客户 | ACK=1 | v | u+1 | 服务器进入关闭等待(CLOSE-WAIT);客户进入终止等待二(FIN-WAIT-2) | 对报文①的确认;此时客户→服务器方向连接释放,进入半关闭状态 |
| ③ 连接释放报文段 | 服务器 → 客户 | FIN=1, ACK=1 | w | u+1 | 服务器进入最后确认(LAST-ACK) | w = 服务器已传送数据末字节序号 + 1(半关闭期间可能又发了数据);ack=u+1 是对报文①的重复确认 |
| ④ 普通确认报文段 | 客户 → 服务器 | ACK=1 | u+1 | w+1 | 服务器进入关闭状态;客户进入时间等待(TIME-WAIT),经 2MSL 后进入关闭状态 | 对报文③的确认;seq=u+1 因报文①消耗了序号 u |
半关闭状态
- 报文②之后,从客户到服务器方向的连接已释放,但服务器到客户方向并未关闭。
- 此时 TCP 客户进程没有数据要发送了,但若服务器还有数据要发送,客户仍要接收。
- 半关闭状态可能持续一段时间。
Mermaid 时序图
3. TIME_WAIT 状态与 2MSL
- MSL(最长报文段寿命,Maximum Segment Lifetime):RFC 793 建议为 2 分钟,即客户进入 TIME-WAIT 后还要经过 4 分钟(2×MSL)才进入关闭状态。
- 现代网络中 MSL=2 分钟可能太长,TCP 允许不同实现使用更小的 MSL 值。
- 经过 2 倍 MSL 后,客户进程撤销传输控制块,结束本次 TCP 连接。
为什么 TIME-WAIT 要等待 2MSL?
原因一:确保服务器能收到最终确认,正常关闭
- 若客户发送完报文④后直接进入关闭状态(而非 TIME-WAIT)。
- 若报文④丢失,服务器会对报文③超时重传,仍处于最后确认状态。
- 重传的报文③到达客户,但客户已处于关闭状态,不理睬该报文。
- 服务器反复重传报文③,一直处于最后确认状态,无法进入关闭状态。
- 处于 TIME-WAIT 并等待 2MSL,可确保服务器收到最终确认报文后能进入关闭状态。
原因二:使本次连接产生的所有报文段从网络中消失
经过 2MSL,本次连接持续时间内产生的所有报文段都会从网络中消失。
这样下一个新的 TCP 连接中不会出现旧连接中的报文段。
⚠️ 重点/考点:TIME-WAIT 等待 2MSL 的两大作用必须牢记——①保证服务器能收到最终确认而正常关闭;②使本次连接的所有报文段从网络中消失,防止旧报文干扰新连接。
4. 408 考研真题演练(答案 C)
综合三报文握手与四报文挥手的序号计算:
主机甲(TCP 客户)发送连接请求报文段 seq=1000。
- 连接请求报文段不携带数据但消耗一个序号 → 第二个报文段(普通确认)seq=1001。
- 普通确认报文段不携带数据不消耗序号 → 成功建立连接后甲发送的第一个 TCP 数据报文段序号仍为 1001(即第一个应用层数据字节的 TCP 序号为 1001)。
主机甲发送给主机乙的 FIN 段 seq=5001。
- 连接释放报文段不携带数据也消耗一个序号 → 甲在发送 FIN 段之前,最后一个应用层数据字节的 TCP 序号为 5000。
结论:主机甲向主机乙已发送字节序号为 1001~5000,共 4000 个字节的应用层数据。
⚠️ 重点/考点:
- SYN=1 的报文段消耗一个序号;FIN=1 的报文段也消耗一个序号。
- 普通确认报文段不携带数据时不消耗序号 → 连接建立后第一个数据报文段序号 = 连接请求序号 + 1。
- FIN 段 seq = 最后一个应用层数据字节序号 + 1。
5. 保活计时器
作用场景
- 假设 TCP 双方已建立连接,后来 TCP 客户进程所在主机突然出现故障,不可能再发送数据。服务器如何知道客户出现故障?
工作原理
- TCP 服务器进程每收到一次客户进程的数据,就重新设置并启动保活计时器(通常为 2 小时)。
- 当保活计时器到时,服务器向客户发送一个探测报文段。
- 之后每隔 75 秒发送一次探测报文段。
- 若一连发送 10 个探测报文段后仍无客户响应,服务器就认为客户所在主机出现故障,关闭这个连接。
💡 核心总结
- 四报文挥手:FIN=1(seq=u)→ ACK=1(ack=u+1)→ FIN=1(seq=w, ack=u+1)→ ACK=1(seq=u+1, ack=w+1)。
- 报文②后进入半关闭状态:客户→服务器方向关闭,服务器→客户方向仍可传数据。
- FIN=1 的报文段即使不携带数据也消耗一个序号。
- TIME-WAIT 等待 2MSL:①保证服务器收到最终确认正常关闭;②使旧报文从网络消失,不干扰新连接。
- 保活计时器(2 小时)用于检测客户主机故障,每 75 秒探测一次,10 次无响应则关闭连接。
❓ 课后思考 / 经典考题
- 四报文挥手中,四个报文段的 seq 和 ack 分别如何取值?半关闭状态是什么含义?
- TIME-WAIT 状态为什么要等待 2MSL 而不是直接关闭?请从两个角度说明。
- 若最后一个确认报文段(报文④)丢失,会发生什么?TIME-WAIT 如何解决这个问题?
- (408 真题)主机甲连接请求 seq=1000,FIN 段 seq=5001,则甲已发送多少字节的应用层数据?字节序号范围是多少?
- 保活计时器的作用是什么?服务器连续发送多少个探测报文段无响应后才关闭连接?