📖 "四报文挥手"释放 TCP 连接

🎯 课程摘要：本节课详细讲解"四报文挥手"释放 TCP 连接的完整过程（FIN → ACK → FIN → ACK），阐述半关闭状态、各状态的序号与确认号变化，重点解释 TIME_WAIT 状态为何要等待 2MSL（确保服务器收到最终确认 + 使旧报文从网络消失），并介绍保活计时器的作用，最后通过 408 考研真题综合考查三报文握手与四报文挥手的序号计算。

📝 详细笔记

1. 释放连接的基本概念

TCP 通信双方都可以释放 TCP 连接，将释放连接的过程比喻为"挥手"，需要在 TCP 客户和服务器之间交换四个 TCP 报文段。
假设使用 TCP 客户进程的应用进程通知其主动关闭 TCP 连接（由客户主动发起，故客户为主动关闭方，服务器为被动关闭方）。

2. 四报文挥手完整过程

四个报文段详解

报文	方向	标志位	seq	ack	状态变化	说明
① 连接释放报文段	客户 → 服务器	FIN=1, ACK=1	u	v	客户进入终止等待一（FIN-WAIT-1）	u = 客户已传送数据末字节序号 + 1；v = 客户已收数据末字节序号 + 1；FIN=1 即使不携带数据也消耗一个序号
② 普通确认报文段	服务器 → 客户	ACK=1	v	u+1	服务器进入关闭等待（CLOSE-WAIT）；客户进入终止等待二（FIN-WAIT-2）	对报文①的确认；此时客户→服务器方向连接释放，进入半关闭状态
③ 连接释放报文段	服务器 → 客户	FIN=1, ACK=1	w	u+1	服务器进入最后确认（LAST-ACK）	w = 服务器已传送数据末字节序号 + 1（半关闭期间可能又发了数据）；ack=u+1 是对报文①的重复确认
④ 普通确认报文段	客户 → 服务器	ACK=1	u+1	w+1	服务器进入关闭状态；客户进入时间等待（TIME-WAIT），经 2MSL 后进入关闭状态	对报文③的确认；seq=u+1 因报文①消耗了序号 u

半关闭状态

报文②之后，从客户到服务器方向的连接已释放，但服务器到客户方向并未关闭。
此时 TCP 客户进程没有数据要发送了，但若服务器还有数据要发送，客户仍要接收。
半关闭状态可能持续一段时间。

Mermaid 时序图

3. TIME_WAIT 状态与 2MSL

MSL（最长报文段寿命，Maximum Segment Lifetime）：RFC 793 建议为 2 分钟，即客户进入 TIME-WAIT 后还要经过 4 分钟（2×MSL）才进入关闭状态。
现代网络中 MSL=2 分钟可能太长，TCP 允许不同实现使用更小的 MSL 值。
经过 2 倍 MSL 后，客户进程撤销传输控制块，结束本次 TCP 连接。

为什么 TIME-WAIT 要等待 2MSL？

原因一：确保服务器能收到最终确认，正常关闭

若客户发送完报文④后直接进入关闭状态（而非 TIME-WAIT）。
若报文④丢失，服务器会对报文③超时重传，仍处于最后确认状态。
重传的报文③到达客户，但客户已处于关闭状态，不理睬该报文。
服务器反复重传报文③，一直处于最后确认状态，无法进入关闭状态。
处于 TIME-WAIT 并等待 2MSL，可确保服务器收到最终确认报文后能进入关闭状态。

原因二：使本次连接产生的所有报文段从网络中消失

经过 2MSL，本次连接持续时间内产生的所有报文段都会从网络中消失。
这样下一个新的 TCP 连接中不会出现旧连接中的报文段。
⚠️ 重点/考点：TIME-WAIT 等待 2MSL 的两大作用必须牢记——①保证服务器能收到最终确认而正常关闭；②使本次连接的所有报文段从网络中消失，防止旧报文干扰新连接。

4. 408 考研真题演练（答案 C）

综合三报文握手与四报文挥手的序号计算：

主机甲（TCP 客户）发送连接请求报文段 seq=1000。
- 连接请求报文段不携带数据但消耗一个序号 → 第二个报文段（普通确认）seq=1001。
- 普通确认报文段不携带数据不消耗序号 → 成功建立连接后甲发送的第一个 TCP 数据报文段序号仍为 1001（即第一个应用层数据字节的 TCP 序号为 1001）。
主机甲发送给主机乙的 FIN 段 seq=5001。
- 连接释放报文段不携带数据也消耗一个序号 → 甲在发送 FIN 段之前，最后一个应用层数据字节的 TCP 序号为 5000。
结论：主机甲向主机乙已发送字节序号为 1001~5000，共 4000 个字节的应用层数据。
⚠️ 重点/考点：
- SYN=1 的报文段消耗一个序号；FIN=1 的报文段也消耗一个序号。
- 普通确认报文段不携带数据时不消耗序号 → 连接建立后第一个数据报文段序号 = 连接请求序号 + 1。
- FIN 段 seq = 最后一个应用层数据字节序号 + 1。

5. 保活计时器

作用场景

假设 TCP 双方已建立连接，后来 TCP 客户进程所在主机突然出现故障，不可能再发送数据。服务器如何知道客户出现故障？

工作原理

TCP 服务器进程每收到一次客户进程的数据，就重新设置并启动保活计时器（通常为 2 小时）。
当保活计时器到时，服务器向客户发送一个探测报文段。
之后每隔 75 秒发送一次探测报文段。
若一连发送 10 个探测报文段后仍无客户响应，服务器就认为客户所在主机出现故障，关闭这个连接。

💡 核心总结

四报文挥手：FIN=1（seq=u）→ ACK=1（ack=u+1）→ FIN=1（seq=w, ack=u+1）→ ACK=1（seq=u+1, ack=w+1）。
报文②后进入半关闭状态：客户→服务器方向关闭，服务器→客户方向仍可传数据。
FIN=1 的报文段即使不携带数据也消耗一个序号。
TIME-WAIT 等待 2MSL：①保证服务器收到最终确认正常关闭；②使旧报文从网络消失，不干扰新连接。
保活计时器（2 小时）用于检测客户主机故障，每 75 秒探测一次，10 次无响应则关闭连接。

❓ 课后思考 / 经典考题

四报文挥手中，四个报文段的 seq 和 ack 分别如何取值？半关闭状态是什么含义？
TIME-WAIT 状态为什么要等待 2MSL 而不是直接关闭？请从两个角度说明。
若最后一个确认报文段（报文④）丢失，会发生什么？TIME-WAIT 如何解决这个问题？
（408 真题）主机甲连接请求 seq=1000，FIN 段 seq=5001，则甲已发送多少字节的应用层数据？字节序号范围是多少？
保活计时器的作用是什么？服务器连续发送多少个探测报文段无响应后才关闭连接？