课程笔记:TCP 报文段格式与 IP 分组
课程名称:计算机网络应用 核心摘要:本节深入剖析 TCP 报文段(Segment)的各字段构成(端口号、序号、确认号、控制位、窗口、校验和等),阐明 MSS 的含义与默认值;并讲解 IP 分组的首部结构,说明 TCP 连接由"源 IP、源端口、目标 IP、目标端口"四元组唯一确定。
一、 核心概念与原理
- TCP 可靠性机制:TCP 采用 发送—应答(Send-Acknowledge)方式保证数据传输的可靠性。上层协议(如 HTTP)的整个报文会被操作系统切分成多个 TCP 段(Segment) 后逐段发送,接收端依据序号重组还原完整报文。
- 分段顺序传输:报文按序号顺序发送(先发 1 段、再发 2 段……直至 N 段),非随机发送;接收端收到全部段后完成重组。
- MSS(Maximum Segment Size,最大报文段长度):
- 控制 TCP 段中数据部分的最大长度。
- 仅指数据载荷大小,不包含 TCP 首部。
- 主机默认 MSS 通常为 536 字节。
- IP 分组(IP Datagram/Packet):
- IP 层发送的数据单元称为分组(也叫数据报),区别于传输层的"报文段"。
- IP 首部通常为 20 字节,其中包含源 IP 地址与目标 IP 地址。
- 一个 IP 分组 = IP 首部 + TCP 首部 + TCP 数据。
- TCP 连接四元组:仅有 TCP 的源/目标端口号无法确定唯一连接,必须借助 IP 层的源/目标 IP 地址。四元组共同标识一条唯一 TCP 连接。
二、 技术细节与协议分析
2.1 TCP 报文段首部格式
| 字段 | 位数 | 字节数 | 说明 |
|---|---|---|---|
| 源端口号(Source Port) | 16 位 | 2 字节 | 标记本机上发送数据的进程 |
| 目标端口号(Destination Port) | 16 位 | 2 字节 | 标记目标主机上接收数据的进程 |
| 序号(Sequence Number, seq) | 32 位 | 4 字节 | 标识报文段在整体报文中的顺序,决定发送与重组顺序 |
| 确认序号(Acknowledgment Number, ack) | 32 位 | 4 字节 | 期望收到对方下一个报文段的序号(如 seq=u,则 ack=u+1) |
| 首部长度(Header Length) | 4 位 | — | 指示 TCP 首部长度 |
| 保留位(Reserved) | 6 位 | — | 当前无意义,通常置 0;为将来定义新用途保留 |
| 控制位(Control Flags) | — | — | URG / ACK / PSH / RST / SYN / FIN,见下表 |
| 窗口大小(Window Size) | 16 位 | 2 字节 | 通知发送方本端接收缓存大小(滑动窗口) |
| 校验和(Checksum) | 16 位 | 2 字节 | 对首部 + 数据整体校验;发送端计算,接收端验证 |
| 紧急指针(Urgent Pointer) | 16 位 | 2 字节 | 仅当 URG=1 有效,为一个正偏移量,与序号相加得到紧急数据末字节的序号 |
| 选项与填充(Options & Padding) | 可变 | — | 常用于存放本段数据大小(如 MSS 协商)等信息 |
| 数据(Data) | 可变 | — | 实际载荷,可选(如纯 ACK 报文无数据) |
2.2 控制位(Flags)详解
| 标志 | 全称 | 取值含义 | 典型场景 |
|---|---|---|---|
| URG | Urgent | URG=1:紧急指针有效;URG=0:忽略紧急指针(通常为 0) | 紧急数据传输 |
| ACK | Acknowledgment | ACK=1:确认号有效;ACK=0:忽略确认号 | 三次握手 / 四次挥手中确认 |
| PSH | Push | PSH=1:接收方应尽快将数据交给应用程序,而非在缓冲区排队 | 交互式、低延迟传输 |
| RST | Reset | 重置连接标志 | 主机崩溃导致连接错误时重置;拒绝非法报文段 / 拒绝连接请求 |
| SYN | Synchronize | 同步序号标志。连接请求 SYN=1, ACK=0(未捎带确认);连接应答 SYN=1, ACK=1(捎带确认) | 建立连接(三次握手) |
| FIN | Finish | FIN=1:发送方已无数据发送,请求结束连接 | 四次挥手(第一次挥手) |
2.3 确认序号示例(四次挥手)
- 客户端发起第一次挥手:序列号
seq = u - 对方回复时确认序号
ack = u + 1
2.4 TCP 连接唯一性 — 四元组
唯一确定一条 TCP 连接需四个值:
{ 源 IP 地址, 源端口号, 目标 IP 地址, 目标端口号 }
规则:在任何时刻,两条不同的 TCP 连接不能同时拥有四个完全相同的值。
典型场景(多客户端连同一服务端口):
| 客户端 IP | 客户端端口 | 服务器 IP | 服务器端口 | 是否冲突 |
|---|---|---|---|---|
| Client_A | 2023 | Server_X | 4433 | 否 |
| Client_A | 3227 | Server_X | 4433 | 否(端口不同) |
| Client_A | 3105 | Server_Y | 80 | 否(目标不同) |
| Client_B | 5100 | Server_Y | 80 | 否(源 IP 不同) |
类比 Nginx:同一服务器的 80/8080 端口可同时承载多个客户端连接,因为各客户端的源 IP 或源端口各不相同。但同一 IP 同一源端口不能同时建立两个连接。
2.5 IP 分组结构示意
+------------------+
| IP 首部 (20B) | ← 含源 IP、目标 IP
+------------------+
| TCP 首部 (20B) | ← 含源端口、目标端口、序号、确认号、控制位等
+------------------+
| TCP 数据载荷 | ← MSS 限制的最大长度(默认 536B)
+------------------+
三、 实践应用与配置命令
本节以理论讲解为主,无具体抓包或设备配置命令实操内容。建议结合 Wireshark 抓包验证:
# Wireshark 过滤 TCP 报文并观察四元组与控制位
tcp # 查看所有 TCP 报文段
tcp.flags.syn == 1 # 仅查看 SYN 报文(握手)
tcp.flags.fin == 1 # 仅查看 FIN 报文(挥手)
tcp.flags.reset == 1 # 查看 RST 重置连接
tcp.port == 80 # 查看 80 端口流量
四、 重点与难点提示
- MSS 易错点:MSS 指 TCP 段数据部分最大长度,不含 TCP 首部;默认值 536 字节需牢记。
- 位/字节换算:16 位 = 2 字节,32 位 = 4 字节;注意区分各字段宽度。
- 四元组唯一性:TCP 连接由源 IP + 源端口 + 目标 IP + 目标端口共同标识,仅有端口号不够(端口号仅区分同一主机上的不同进程)。
- 控制位语义:SYN(建立)、FIN(关闭)、ACK(确认)、RST(重置/拒绝)、PSH(推送)、URG(紧急)需准确区分,是握手/挥手分析的核心。
- SYN 与 ACK 组合:连接请求
SYN=1, ACK=0;连接应答SYN=1, ACK=1(捎带确认)。 - 紧急指针:仅当
URG=1时有效,本质为正偏移量,与序号相加得到紧急数据末字节序号。 - 校验和范围:覆盖 TCP 首部 + 数据,发送端计算、接收端校验。
- 面试高频:TCP 报文段首部各字段、四元组唯一连接、MSS 与 MTU 的关系。
五、 课后疑问/遗留问题
- MSS(最大报文段长度)与 MTU(最大传输单元)之间存在怎样的换算关系?为何默认 MSS 取 536 字节?
- 滑动窗口协议如何基于"窗口大小"字段实现流量控制?后续课程将详细讲解。
- TCP 选项字段除 MSS 外还承载哪些协商内容(如窗口扩大选项、SACK、时间戳)?
- IP 首部除源/目标 IP 外还包含哪些关键字段(TTL、协议号、标识、标志等)?待后续 IP 分组专题展开。
- 当四元组完全相同时,操作系统如何区分同一连接的多个数据段?TIME_WAIT 状态与端口复用如何处理冲突?