VuePress 站点
首页
数学
计算机基础
Java后端
AI大模型
UI设计
首页
数学
计算机基础
Java后端
AI大模型
UI设计
  • 计算机基础
  • 计算机网络应用

    • 课程笔记:TCP三次握手建立连接
    • 课程笔记:TCP三次握手的必要性
    • 课程笔记:TCP协议缺陷与SYN Flood攻击
    • 课程笔记:TCP四次挥手释放连接
    • 课程笔记:TCP四次挥手释放连接的必要性
    • 课程笔记:TCP 报文段格式与 IP 分组
    • 课程笔记:HTTP/2 新特性——二进制分帧
    • 课程笔记:HTTP/2 新特性——多路复用
    • 课程笔记:HTTP/2 新特性——服务器推送(Server Push)
    • 课程笔记:HTTPS 简介与架构图
    • 课程笔记:HTTPS原理与传输层安全协议(TLS)
    • 课程笔记:HTTPS原理——对称加密算法
    • 课程笔记:HTTPS原理——非对称加密算法
    • 课程笔记:HTTPS 原理 —— 数字签名
    • 课程笔记:HTTPS 原理——证书与 CA
    • 课程笔记:完整的HTTPS协议通信流程
    • 课程笔记:HTTPS 协议的性能损耗
    • 课程笔记:TLS False Start 加速 HTTPS
    • 课程笔记:升级 HTTP 协议到 HTTP/2
    • 课程笔记:通过会话恢复加速 HTTPS
    • 课程笔记:OWASP 组织与十大 Web 安全漏洞
    • 课程笔记:XSS 跨站脚本攻击
    • 课程笔记:存储型XSS跨站脚本攻击
    • 课程笔记:XSS攻击窃取Cookie
    • 课程笔记:反射型XSS跨站脚本攻击
    • 课程笔记:DOM型XSS跨站脚本攻击
    • 课程笔记:植入 JS、HTML 代码攻击
    • 课程笔记:XSS攻击的防护策略
    • 课程笔记:XSS攻击的输入环节防护
    • 课程笔记:XSS 劫持 Cookie 的防护策略
    • 课程笔记:XSS 内容输出防护方案
    • 课程笔记:CSP 内容安全策略
    • 课程笔记:CSP 内容安全策略的应用方式
    • 课程笔记:CSRF 跨站请求伪造攻击原理
    • 课程笔记:CSRF 跨站点请求伪造攻击案例
    • 课程笔记:CSRF 跨站请求伪造防护方案
    • 课程笔记:OWASP CSRFTester 工具的原理与使用
    • 课程笔记:点击劫持攻击原理
    • 课程笔记:点击劫持防护方案
    • 课程笔记:URL 跳转漏洞原理与防护
    • 课程笔记:Session 认证与会话劫持
    • 课程笔记:Session固定与Session保持攻击
    • 课程笔记:注入攻击与 OWASP 靶机平台
    • 课程笔记:SQL盲注与ORM注入攻击及防护
    • 课程笔记:XML注入、代码注入、OS命令注入攻击
    • 课程笔记:文件上传漏洞与文件下载/目录浏览漏洞
    • 课程笔记:访问控制与权限访问漏洞
    • 课程笔记:DDoS 分布式拒绝服务攻击原理与防护
    • 课程笔记:CC(Challenge Collapsar)攻击与防护
    • 课程笔记:CDN 的工作原理
    • 课程笔记:CDN的网络架构和术语说明
    • 课程笔记:CDN应用场景与阿里云CDN
    • 课程笔记:如何使用阿里云CDN服务
    • 课程笔记:CDN 刷新与预热
    • 课程笔记:阿里云 CDN 回源配置
    • 课程笔记:CDN 缓存配置
    • 课程笔记:CDN 访问控制与性能优化
  • 计算机网网络

    • 📖 教材介绍与课程导言
    • 📖 1.1 信息时代的计算机网络
    • 📖 1.2 因特网概述
    • 📖 1.3 电路交换、分组交换和报文交换
    • 📖 1.4 计算机网络的定义和分类
    • 📖 1.5 计算机网络的性能指标(1)
    • 📖 1.5 计算机网络的性能指标(2)
    • 📖 1.6.1 常见的三种计算机网络体系结构
    • 📖 1.6.2 计算机网络体系结构分层的必要性
    • 📖 1.6.3 计算机网络体系结构分层思想举例
    • 📖 计算机网络体系结构中的专用术语
    • 📖 物理层概述
    • 📖 物理层下面的传输媒体
    • 📖 传输方式
    • 📖 编码与调制
    • 📖 2.5 信道的极限容量
    • 📖 2.6 信道复用技术
    • 📖 3.1 数据链路层概述
    • 📖 3.2 数据链路层的三个重要问题
    • 📖 3.2.1 封装成帧和透明传输
    • 📖 3.2.2 差错检测
    • 📖 3.2.3 (1) 可靠传输的相关基本概念
    • 📖 3.2.3 (2) 可靠传输的实现机制 - 停止-等待协议(SW)
    • 📖 3.2.3 (3) 可靠传输的实现机制 - 回退N帧协议(GBN)
    • 📖 3.2.3 (4) 可靠传输的实现机制 - 选择重传协议(SR)
    • 📖 3.3 点对点协议 PPP
    • 📖 3.4 共享式以太网
    • 📖 3.4.1 网络适配器和 MAC 地址
    • 📖 3.4.2 (1) CSMA/CD 协议的基本原理
    • 📖 3.4.2 (2) 共享式以太网的争用期、最小帧长和最大帧长
    • 📖 3.4.2 (3) 共享式以太网的退避算法和信道利用率
    • 📖 3.4.3 使用集线器的共享式以太网
    • 📖 3.4.4 在物理层扩展以太网
    • 📖 3.4.5 (1) 网桥的主要结构和基本工作原理
    • 📖 3.4.5 (2) 透明网桥的自学习和转发帧的过程以及生成树协议STP
    • 📖 3.5 交换式以太网
    • 📖 3.5.1 以太网交换机
    • 📖 3.5.2 共享式以太网和交换式以太网的对比
    • 📖 3.6 以太网的MAC帧格式
    • 📖 3.7.1 虚拟局域网 VLAN 概述
    • 📖 3.7.2 虚拟局域网 VLAN 的实现机制
    • 📖 3.8 以太网的发展
    • 📖 3.9.1 802.11 无线局域网的组成
    • 📖 3.9.2 802.11 无线局域网的物理层
    • 📖 3.9.3 (1) 802.11 无线局域网的数据链路层 —— 使用 CSMA/CA 协议(而不使用 CSMA/CD 协议)
    • 📖 CSMA/CA(载波监听多址接入/碰撞避免)协议的基本工作原理
    • 📖 802.11 无线局域网的 MAC 帧格式
    • 📖 网络层概述
    • 📖 网际协议 IP(网际协议)与异构网络互连
    • 📖 IPv4 地址及其编址方法——概述
    • 📖 IPv4 地址的分类编址方法
    • 📖 IPv4 地址的划分子网编址方法
    • 📖 IPv4 地址的无分类编址方法(CIDR)
    • 📖 IPv4 地址的应用规划
    • 📖 IPv4 地址与 MAC 地址
    • 📖 地址解析协议 ARP
    • 📖 IP 数据报的发送和转发流程
    • 📖 IPv4 数据报的首部格式
    • 📖 静态路由配置
    • 📖 因特网的路由选择协议概述
    • 📖 路由信息协议 RIP(路由信息协议)
    • 📖 开放最短路径优先 OSPF(开放最短路径优先)
    • 📖 边界网关协议 BGP(边界网关协议)
    • 📖 路由器的基本工作原理
    • 📖 网际控制报文协议 ICMP(网际控制报文协议)
    • 📖 虚拟专用网 VPN 和网络地址转换 NAT
    • 📖 IP 多播技术的相关基本概念
    • 📖 在局域网上进行硬件多播
    • 📖 在因特网上进行 IP 多播需要的两种协议
    • 📖 网际组管理协议 IGMP
    • 📖 多播路由选择协议
    • 📖 移动 IP 技术概述
    • 📖 IPv6 引进的主要变化
    • 📖 IPv6 数据报的基本首部和扩展首部
    • 📖 IPv6 地址
    • 📖 从 IPv4 向 IPv6 过渡
    • 📖 网际控制报文协议 ICMPv6
    • 📖 软件定义网络 SDN
    • 📖 运输层概述 — 进程间基于网络的通信
    • 📖 TCP/IP 体系结构运输层中的两个重要协议
    • 📖 运输层端口号、复用与分用的概念
    • 📖 UDP 和 TCP 的对比
    • 📖 TCP 报文段的首部格式
    • 📖 "三报文握手"建立 TCP 连接
    • 📖 "四报文挥手"释放 TCP 连接
    • 📖 TCP 的流量控制 (Flow Control)
    • 📖 TCP 的拥塞控制 (Congestion Control) 及与网际层拥塞控制的关系
    • 📖 TCP 可靠传输的实现
    • 📖 TCP 超时重传时间 (RTO) 的选择
    • 📖 TCP 的选择确认 (SACK)
    • 📖 6.1 应用层概述
    • 📖 6.2 客户—服务器方式和对等方式
    • 📖 6.3 动态主机配置协议 DHCP
    • 📖 6.4 域名系统 DNS
    • 📖 6.5 文件传送协议 FTP
    • 📖 电子邮件
    • 📖 万维网 WWW
    • 📖 网络安全概述
    • 📖 密码学相关基本概念
    • 📖 对称密钥密码体制
    • 📖 公钥密码体制
    • 📖 报文摘要和报文鉴别码
    • 📖 数字签名(digital signature)
    • 📖 实体鉴别
    • 📖 密钥分发
    • 📖 访问控制
    • 📖 网络体系结构各层采取的安全措施—物理层和数据链路层
    • 📖 网络体系结构各层采取的安全措施—网络层
    • 📖 网络体系结构各层采取的安全措施—运输层
    • 📖 网络体系结构各层采取的安全措施—应用层
    • 📖 防火墙访问控制与入侵检测系统
    • 📖 常见的网络攻击及其防范
    • 📖 定长子网划分和变长子网划分的二叉树解法

课程笔记:XML注入、代码注入、OS命令注入攻击

课程名称:计算机网络应用 核心摘要:本讲延续 SQL 注入主题,系统讲解三种注入攻击:XML 注入(用户数据被当作 XML 节点解析)、代码注入(Code Injection,主要为 JS 脚本注入)、OS 命令注入(OS Command Injection,将输入作为操作系统命令执行)。重点剖析三类攻击的成因、案例、危害及防护方案,强调"数据与代码分离"原则。

一、 核心概念与原理

1.1 注入攻击的共性原理

所有注入攻击都违背了一个根本原则——数据与代码分离:

  • 程序把用户输入的数据当作代码/节点/命令去执行或解析
  • 未对输入做转义、校验或隔离,导致恶意构造的数据改变程序原有语义

1.2 注入攻击两大成立条件

序号条件说明
1用户能控制数据的录入如通过 request.getParameter() 获取用户输入
2程序直接拼接数据未做任何转义或校验,直接拼入可执行上下文

1.3 三类注入攻击对比

对比维度SQL 注入XML 注入代码注入OS 命令注入
注入载体SQL 语句XML 节点JS/脚本代码操作系统命令
执行环境数据库引擎XML 解析器脚本引擎(如 JS 引擎)操作系统 Shell
出现频率高较低(微服务时代 XML 存储减少)较低(Java Web 中少见)较低(系统很少对外开放)
危害程度高中极高极高

二、 技术细节与协议分析

2.1 XML 注入(XML Injection)

定义:将用户录入的信息作为 XML 节点 解析执行,而非普通文本数据。

发生场景:对 XML 数据做查询或修改(增、删、改均属修改)时,输入或输出的参考数据均可能引发漏洞。

攻击案例剖析

服务端期望用户录入两个参数(name、email),拼接为 XML:

<!-- 正常输入 -->
<user>
  <name>郭德纲</name>
  <email>guodegang@deyunshe.com</email>
</user>

恶意用户在第二个参数中注入额外标签,闭合原标签并新增节点:

<!-- 恶意输入(email 参数) -->
user1@lagou.com</email>
</user>
<user>
  <name>user2</name>
  <email>user2@lagou.com

结果:原本应录入 1 条数据,实际被解析为 2 条 user 记录,完成 XML 注入。

防护方案

保存或展示前对数据做转义,使用工具类对特殊字符编码:

// 使用 Apache Commons 工具类进行 XML 编码转义
String safeName = StringEscapeUtils.escapeXml(request.getParameter("name"));
String safeEmail = StringEscapeUtils.escapeXml(request.getParameter("email"));

转义后,用户输入的 <、> 等标签符号变为普通文本,不再被解析为 XML 节点。

2.2 代码注入(Code Injection)

定义:允许用户输入代码片段并在服务器端执行,未做判断与控制,导致恶意代码运行。

Java Web 中少见的原因:

  • Java 代码需经编译(.java → .class)才能由 JVM 运行,无法直接注入执行
  • 实际威胁多为 JS 脚本注入(浏览器内置 JS 引擎可直接解释执行)
  • 故"代码注入"更准确的称呼是 脚本注入

攻击案例剖析

通过 Java 脚本引擎 API 执行用户输入的 JS 代码:

// 1. 初始化脚本引擎管理器
ScriptEngineManager manager = new ScriptEngineManager();
// 2. 获取 JavaScript 脚本引擎
ScriptEngine engine = manager.getEngineByName("JavaScript");
// 3. 执行用户输入(危险!未做校验)
engine.eval(request.getParameter("code"));

正常输入:print("hello");

恶意输入(导入 Java 文件包并在磁盘创建文件):

// 前面正常打印,后面导入 Java IO 包创建文件
print("hello");
importPackage(java.io);
var f = new File("attack.txt");
f.createNewFile();
// 进一步可通过流扫描磁盘、修改数据文件

危害:恶意用户可远程控制服务器,获取服务器权限,篡改资源,甚至控制数据库。

防护方案

防护策略具体做法
禁用危险函数禁止 eval 等执行命令的函数
输入限制执行代码的参数、文件名禁止与用户输入相关
索引化输入仅允许用户输入 1/2/3 等索引号,由程序映射到具体操作
白名单机制限制可用函数集合,仅允许安全函数

根本原则:代码注入由不安全的编程习惯引起,危险函数应避免在开发中使用;若非必须,不应让用户输入代码。

2.3 OS 命令注入(OS Command Injection)

定义:注入的有效载荷(payload)被作为操作系统命令执行。OS = Operating System(操作系统)。

主流服务器系统:

技术栈部署系统
ASP.NET / C#(微软技术栈)Windows Server
PHP / Java 开发Linux

常用系统命令复习

功能LinuxWindows
查看当前用户whoamiwhoami
查看系统信息uname -a—
网络配置ifconfigipconfig
查看网络连接netstat -annetstat -an
查看进程ps -ef—

攻击案例剖析

功能场景:验证服务器到目标 IP 的网络状况(ping 命令)。

服务端代码(未校验):

// 执行 shell 脚本,拼接用户输入的 IP
String ip = request.getParameter("ip");
Runtime.getRuntime().exec("ping " + ip);

正常输入:127.0.0.1

恶意输入(利用命令连接符追加执行其他命令):

# 输入内容:ping 127.0.0.1 && whoami
127.0.0.1 && whoami

结果:服务端不仅执行 ping,还执行了 whoami(查看当前用户)。进一步可执行 ps -ef(查看进程)、kill(杀死进程)等任意命令,后果极其严重。

注:DVWA 靶机平台提供了 Command Injection 模块用于演练该漏洞。

防护方案

优先级防护策略说明
最优不调用 OS 命令永远不要从应用代码中调用操作系统命令
次优使用安全 API几乎每种场景都有更安全的平台 API 替代
兜底白名单校验仅允许输入特定 IP 地址白名单
兜底正则校验验证输入是否为合法 IP 格式
兜底字符过滤仅允许字母数字,禁止 &&、`

三、 实践应用与配置命令

3.1 XML 注入防护命令

// Apache Commons Lang XML 转义
import org.apache.commons.text.StringEscapeUtils;

String safeInput = StringEscapeUtils.escapeXml11(
    request.getParameter("userData")
);
// 转义规则:< → &lt;  > → &gt;  & → &amp;  " → &quot;  ' → &apos;

3.2 OS 命令注入校验示例

// 正则校验:仅允许合法 IP 格式,排除命令连接符
String ip = request.getParameter("ip");
String ipRegex = "^((25[0-5]|2[0-4]\\d|[01]?\\d\\d?)\\.){3}(25[0-5]|2[0-4]\\d|[01]?\\d\\d?)$";

if (ip != null && ip.matches(ipRegex)) {
    // 校验通过,可执行(仍建议优先用安全 API 替代 ping)
    Process p = Runtime.getRuntime().exec("ping " + ip);
} else {
    // 拒绝非法输入
    throw new IllegalArgumentException("非法 IP 地址");
}

3.3 DVWA 靶机演练

  • 模块:Command Injection
  • 输入框:请输入 IP 地址
  • 正常提交:127.0.0.1 → 返回 ping 结果
  • 注入提交:127.0.0.1 && whoami → 返回 ping 结果 + 当前用户

四、 重点与难点提示

  • 核心原则:所有注入攻击的本质都是违背数据与代码分离——把用户数据当代码执行。
  • 易错点:XML 注入不是注入 SQL,而是注入 XML 节点;区别于 SQL 注入(注入 SQL 语句)。
  • 易错点:Java Web 中代码注入多为 JS 脚本注入而非 Java 代码注入(Java 需编译,JS 由引擎直接解释)。
  • 考点:注入攻击成立的两大条件——①用户可控输入;②程序直接拼接未校验。
  • 考点:OS 命令注入的命令连接符 &&(逻辑与)、||(逻辑或)、;、| 等均可用于追加恶意命令。
  • 防护要点:OS 命令注入最有效的防护是"不调用 OS 命令",用安全 API 替代;其次白名单 + 正则校验。
  • 面试题:简述 XML 注入、代码注入、OS 命令注入的原理及防护方案。
  • 面试题:为什么 Java Web 应用中代码注入较少见?(Java 需编译,JS 才可由浏览器/引擎直接执行)

五、 课后疑问/遗留问题

  1. 微服务架构下 XML 存储被 JSON 等替代,XML 注入是否仍有现实威胁?哪些遗留系统需重点排查?
  2. 代码注入中 ScriptEngine 执行 JS 的场景,是否存在沙箱(Sandbox)隔离方案?
  3. OS 命令注入中,Windows 与 Linux 的命令连接符差异有哪些?如何完整枚举过滤?
  4. ProcessBuilder 相比 Runtime.exec 在安全性上有何优势?后续课程是否会讲解?
  5. 后续课程是否会讲解 反序列化漏洞、LDAP 注入、XPath 注入、日志注入 等其他注入形式?
最近更新: 2026/6/23 17:18
Contributors: yangwenguang
Prev
课程笔记:SQL盲注与ORM注入攻击及防护
Next
课程笔记:文件上传漏洞与文件下载/目录浏览漏洞