VuePress 站点
首页
数学
计算机基础
Java后端
AI大模型
UI设计
首页
数学
计算机基础
Java后端
AI大模型
UI设计
  • 计算机基础
  • 计算机网络应用

    • 课程笔记:TCP三次握手建立连接
    • 课程笔记:TCP三次握手的必要性
    • 课程笔记:TCP协议缺陷与SYN Flood攻击
    • 课程笔记:TCP四次挥手释放连接
    • 课程笔记:TCP四次挥手释放连接的必要性
    • 课程笔记:TCP 报文段格式与 IP 分组
    • 课程笔记:HTTP/2 新特性——二进制分帧
    • 课程笔记:HTTP/2 新特性——多路复用
    • 课程笔记:HTTP/2 新特性——服务器推送(Server Push)
    • 课程笔记:HTTPS 简介与架构图
    • 课程笔记:HTTPS原理与传输层安全协议(TLS)
    • 课程笔记:HTTPS原理——对称加密算法
    • 课程笔记:HTTPS原理——非对称加密算法
    • 课程笔记:HTTPS 原理 —— 数字签名
    • 课程笔记:HTTPS 原理——证书与 CA
    • 课程笔记:完整的HTTPS协议通信流程
    • 课程笔记:HTTPS 协议的性能损耗
    • 课程笔记:TLS False Start 加速 HTTPS
    • 课程笔记:升级 HTTP 协议到 HTTP/2
    • 课程笔记:通过会话恢复加速 HTTPS
    • 课程笔记:OWASP 组织与十大 Web 安全漏洞
    • 课程笔记:XSS 跨站脚本攻击
    • 课程笔记:存储型XSS跨站脚本攻击
    • 课程笔记:XSS攻击窃取Cookie
    • 课程笔记:反射型XSS跨站脚本攻击
    • 课程笔记:DOM型XSS跨站脚本攻击
    • 课程笔记:植入 JS、HTML 代码攻击
    • 课程笔记:XSS攻击的防护策略
    • 课程笔记:XSS攻击的输入环节防护
    • 课程笔记:XSS 劫持 Cookie 的防护策略
    • 课程笔记:XSS 内容输出防护方案
    • 课程笔记:CSP 内容安全策略
    • 课程笔记:CSP 内容安全策略的应用方式
    • 课程笔记:CSRF 跨站请求伪造攻击原理
    • 课程笔记:CSRF 跨站点请求伪造攻击案例
    • 课程笔记:CSRF 跨站请求伪造防护方案
    • 课程笔记:OWASP CSRFTester 工具的原理与使用
    • 课程笔记:点击劫持攻击原理
    • 课程笔记:点击劫持防护方案
    • 课程笔记:URL 跳转漏洞原理与防护
    • 课程笔记:Session 认证与会话劫持
    • 课程笔记:Session固定与Session保持攻击
    • 课程笔记:注入攻击与 OWASP 靶机平台
    • 课程笔记:SQL盲注与ORM注入攻击及防护
    • 课程笔记:XML注入、代码注入、OS命令注入攻击
    • 课程笔记:文件上传漏洞与文件下载/目录浏览漏洞
    • 课程笔记:访问控制与权限访问漏洞
    • 课程笔记:DDoS 分布式拒绝服务攻击原理与防护
    • 课程笔记:CC(Challenge Collapsar)攻击与防护
    • 课程笔记:CDN 的工作原理
    • 课程笔记:CDN的网络架构和术语说明
    • 课程笔记:CDN应用场景与阿里云CDN
    • 课程笔记:如何使用阿里云CDN服务
    • 课程笔记:CDN 刷新与预热
    • 课程笔记:阿里云 CDN 回源配置
    • 课程笔记:CDN 缓存配置
    • 课程笔记:CDN 访问控制与性能优化
  • 计算机网网络

    • 📖 教材介绍与课程导言
    • 📖 1.1 信息时代的计算机网络
    • 📖 1.2 因特网概述
    • 📖 1.3 电路交换、分组交换和报文交换
    • 📖 1.4 计算机网络的定义和分类
    • 📖 1.5 计算机网络的性能指标(1)
    • 📖 1.5 计算机网络的性能指标(2)
    • 📖 1.6.1 常见的三种计算机网络体系结构
    • 📖 1.6.2 计算机网络体系结构分层的必要性
    • 📖 1.6.3 计算机网络体系结构分层思想举例
    • 📖 计算机网络体系结构中的专用术语
    • 📖 物理层概述
    • 📖 物理层下面的传输媒体
    • 📖 传输方式
    • 📖 编码与调制
    • 📖 2.5 信道的极限容量
    • 📖 2.6 信道复用技术
    • 📖 3.1 数据链路层概述
    • 📖 3.2 数据链路层的三个重要问题
    • 📖 3.2.1 封装成帧和透明传输
    • 📖 3.2.2 差错检测
    • 📖 3.2.3 (1) 可靠传输的相关基本概念
    • 📖 3.2.3 (2) 可靠传输的实现机制 - 停止-等待协议(SW)
    • 📖 3.2.3 (3) 可靠传输的实现机制 - 回退N帧协议(GBN)
    • 📖 3.2.3 (4) 可靠传输的实现机制 - 选择重传协议(SR)
    • 📖 3.3 点对点协议 PPP
    • 📖 3.4 共享式以太网
    • 📖 3.4.1 网络适配器和 MAC 地址
    • 📖 3.4.2 (1) CSMA/CD 协议的基本原理
    • 📖 3.4.2 (2) 共享式以太网的争用期、最小帧长和最大帧长
    • 📖 3.4.2 (3) 共享式以太网的退避算法和信道利用率
    • 📖 3.4.3 使用集线器的共享式以太网
    • 📖 3.4.4 在物理层扩展以太网
    • 📖 3.4.5 (1) 网桥的主要结构和基本工作原理
    • 📖 3.4.5 (2) 透明网桥的自学习和转发帧的过程以及生成树协议STP
    • 📖 3.5 交换式以太网
    • 📖 3.5.1 以太网交换机
    • 📖 3.5.2 共享式以太网和交换式以太网的对比
    • 📖 3.6 以太网的MAC帧格式
    • 📖 3.7.1 虚拟局域网 VLAN 概述
    • 📖 3.7.2 虚拟局域网 VLAN 的实现机制
    • 📖 3.8 以太网的发展
    • 📖 3.9.1 802.11 无线局域网的组成
    • 📖 3.9.2 802.11 无线局域网的物理层
    • 📖 3.9.3 (1) 802.11 无线局域网的数据链路层 —— 使用 CSMA/CA 协议(而不使用 CSMA/CD 协议)
    • 📖 CSMA/CA(载波监听多址接入/碰撞避免)协议的基本工作原理
    • 📖 802.11 无线局域网的 MAC 帧格式
    • 📖 网络层概述
    • 📖 网际协议 IP(网际协议)与异构网络互连
    • 📖 IPv4 地址及其编址方法——概述
    • 📖 IPv4 地址的分类编址方法
    • 📖 IPv4 地址的划分子网编址方法
    • 📖 IPv4 地址的无分类编址方法(CIDR)
    • 📖 IPv4 地址的应用规划
    • 📖 IPv4 地址与 MAC 地址
    • 📖 地址解析协议 ARP
    • 📖 IP 数据报的发送和转发流程
    • 📖 IPv4 数据报的首部格式
    • 📖 静态路由配置
    • 📖 因特网的路由选择协议概述
    • 📖 路由信息协议 RIP(路由信息协议)
    • 📖 开放最短路径优先 OSPF(开放最短路径优先)
    • 📖 边界网关协议 BGP(边界网关协议)
    • 📖 路由器的基本工作原理
    • 📖 网际控制报文协议 ICMP(网际控制报文协议)
    • 📖 虚拟专用网 VPN 和网络地址转换 NAT
    • 📖 IP 多播技术的相关基本概念
    • 📖 在局域网上进行硬件多播
    • 📖 在因特网上进行 IP 多播需要的两种协议
    • 📖 网际组管理协议 IGMP
    • 📖 多播路由选择协议
    • 📖 移动 IP 技术概述
    • 📖 IPv6 引进的主要变化
    • 📖 IPv6 数据报的基本首部和扩展首部
    • 📖 IPv6 地址
    • 📖 从 IPv4 向 IPv6 过渡
    • 📖 网际控制报文协议 ICMPv6
    • 📖 软件定义网络 SDN
    • 📖 运输层概述 — 进程间基于网络的通信
    • 📖 TCP/IP 体系结构运输层中的两个重要协议
    • 📖 运输层端口号、复用与分用的概念
    • 📖 UDP 和 TCP 的对比
    • 📖 TCP 报文段的首部格式
    • 📖 "三报文握手"建立 TCP 连接
    • 📖 "四报文挥手"释放 TCP 连接
    • 📖 TCP 的流量控制 (Flow Control)
    • 📖 TCP 的拥塞控制 (Congestion Control) 及与网际层拥塞控制的关系
    • 📖 TCP 可靠传输的实现
    • 📖 TCP 超时重传时间 (RTO) 的选择
    • 📖 TCP 的选择确认 (SACK)
    • 📖 6.1 应用层概述
    • 📖 6.2 客户—服务器方式和对等方式
    • 📖 6.3 动态主机配置协议 DHCP
    • 📖 6.4 域名系统 DNS
    • 📖 6.5 文件传送协议 FTP
    • 📖 电子邮件
    • 📖 万维网 WWW
    • 📖 网络安全概述
    • 📖 密码学相关基本概念
    • 📖 对称密钥密码体制
    • 📖 公钥密码体制
    • 📖 报文摘要和报文鉴别码
    • 📖 数字签名(digital signature)
    • 📖 实体鉴别
    • 📖 密钥分发
    • 📖 访问控制
    • 📖 网络体系结构各层采取的安全措施—物理层和数据链路层
    • 📖 网络体系结构各层采取的安全措施—网络层
    • 📖 网络体系结构各层采取的安全措施—运输层
    • 📖 网络体系结构各层采取的安全措施—应用层
    • 📖 防火墙访问控制与入侵检测系统
    • 📖 常见的网络攻击及其防范
    • 📖 定长子网划分和变长子网划分的二叉树解法

课程笔记:XSS攻击的输入环节防护

课程名称:计算机网络应用 核心摘要:本讲承接上一讲XSS漏洞防护策略的宏观框架,聚焦于"输入环节"的具体实现。讲解如何通过自定义Filter + HttpServletRequestWrapper重写参数获取方法,对用户输入做半角转全角、HTML转义等处理;并介绍OWASP AntiSamy、Apache Commons Text两种开源方案的原理与组合用法,最终在留言板场景中验证防护效果。

一、 核心概念与原理

  • XSS防护四大策略中,本讲聚焦第一项:输入环节防护。
  • 防护落点:作为开发人员,应在**后台(后端)**执行两类校验:
    • 用户录入数据的长度判断
    • 特殊字符的转义(转移/转义)处理
  • 部署位置:通常定义在**流量网关(Gateway)**部分做统一拦截。
  • 实现思路:通过过滤器(Filter)实现全局过滤,拦截所有请求并区分处理。
  • 核心机制:利用包装器模式(Wrapper),将原生 HttpServletRequest 封装为自定义的 XssHttpServletRequestWrapper,在后续调用链中传递被处理过的请求对象。
  • 转义原理:将半角特殊字符转为全角字符,使其丧失HTML/JS语义,浏览器不再当作脚本执行。

二、 技术细节与协议分析

2.1 三大开源/自实现方案对比

方案来源典型类/方法适用场景特点
自定义编码器 XssEncode1自研xssEncode(String)通用参数转义半角转全角,灵活可控
OWASP AntiSamyOWASPAntiSamy.scan()富文本/HTML清洗自带 antisamy.xml 规则配置
Apache Commons TextApacheStringEscapeUtils.escapeHtml4()HTML转义也支持JSON/Script转义

三种方案可组合使用,根据数据类型(纯文本/JSON/脚本)灵活切换。

2.2 AntiSamy 命名由来

  • Anti:反对、对抗
  • Samy:人名,指 Samy Kamkar,在 MySpace 网站制造了第一个 XSS蠕虫攻击
  • 命名含义:反对此类XSS蠕虫,象征安全防护

2.3 需重写的 HttpServletRequestWrapper 方法

重写方法功能说明防护必要性
getParameter(name)按参数名获取单值最常见入口,必做转义
getParameterMap()获取所有参数键值对通过迭代器遍历逐值转义
getParameterValues(name)按参数名获取多值数组每个值均需校验
getHeaders()获取请求头HTTP/1.1后Header使用频繁,防Header注入
getInputStream()流方式读取Body防请求体注入
getRequestBody()读取JSON串防JSON Body注入

2.4 静态资源白名单(排除名单)

通过 request.getServletPath() 获取请求路径,对以下静态资源不做处理,直接放行:

资源类型后缀示例
脚本.js
图片.jpg .gif .png
文档.pdf
样式.css
图标.ico

2.5 自定义转义规则(半角→全角)

半角字符全角字符说明
>>大于号
<<小于号
''单引号
""双引号

转换后语义丢失,即便包含JS脚本也不会被浏览器执行。

三、 实践应用与配置命令

3.1 Maven 依赖引入

<!-- OWASP AntiSamy:富文本/HTML清洗 -->
<dependency>
    <groupId>org.owasp</groupId>
    <artifactId>antisamy</artifactId>
</dependency>

<!-- Apache Commons Text:HTML/JSON/Script转义 -->
<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-text</artifactId>
</dependency>

3.2 Filter 骨架结构

// 自定义过滤器名称
public class XssFilter implements Filter {
    // 拦截所有请求(url-pattern: /*)

    @Override
    public void doFilter(ServletRequest req, ServletResponse resp, FilterChain chain) {
        HttpServletRequest request = (HttpServletRequest) req;
        String path = request.getServletPath();

        // 1. 静态资源白名单:JS/JPG/GIF/PNG/PDF/CSS/ICO 直接放行
        if (isStaticResource(path)) {
            chain.doFilter(req, resp);
            return;
        }

        // 2. 非静态资源:包装为自定义Request,后续链条传递XssRequest
        chain.doFilter(new XssHttpServletRequestWrapper(request), resp);
    }
}

3.3 自定义 Wrapper 重写示例

public class XssHttpServletRequestWrapper extends HttpServletRequestWrapper {

    public XssHttpServletRequestWrapper(HttpServletRequest request) {
        super(request);   // 调用父类构造,持有原生request
    }

    @Override
    public String getParameter(String name) {
        String value = super.getParameter(name);
        return (value == null) ? null : XssEncode1.xssEncode(value);
    }

    @Override
    public Map<String, String[]> getParameterMap() {
        Map<String, String[]> map = super.getParameterMap();
        // 迭代器遍历,逐值调用 xssEncode 转义
        // ...返回处理后的新Map
    }

    @Override
    public String[] getParameterValues(String name) {
        String[] values = super.getParameterValues(name);
        // 对每个元素做转义
    }

    @Override
    public Enumeration<String> getHeaders(String name) {
        // 防Header注入:对Header值转义
    }

    // getInputStream / getRequestBody:针对JSON Body转义
}

3.4 三种编码器调用切换

// 方案1:自定义半角转全角
XssEncode1.xssEncode(value);

// 方案2:OWASP AntiSamy(静态块加载antisamy.xml → scan → 输出)
AntiSamy antiSamy = new AntiSamy();
CleanResults results = antiSamy.scan(value, policy);
String clean = results.getCleanHTML();

// 方案3:Apache Commons Text
StringEscapeUtils.escapeHtml4(value);          // HTML转义
StringEscapeUtils.escapeJson(value);           // JSON转义(按需)

3.5 演示验证流程

  1. 重启项目使过滤器生效
  2. 留言板提交弹窗型XSS payload(如 <script>alert(1)</script>)
  3. 重新登录(账号 admin / 密码 123456)
  4. 查询留言 → 看到内容已被转义输出,脚本不再执行

四、 重点与难点提示

  • 考点1:XSS输入防护应放在后端做长度限制 + 特殊字符转义,而非仅靠前端。
  • 考点2:**白名单(排除名单)**思想——静态资源放行,动态请求才过滤。
  • 考点3:Wrapper模式是Servlet规范中扩展请求处理的标准做法,务必重写所有取参方法(含Header/Body)。
  • 易错点:只重写 getParameter 而漏掉 getInputStream/getRequestBody,会导致JSON接口仍可被注入。
  • 易错点:混淆半角/全角转换与HTML实体转义——前者破坏语义,后者编码语义,二者均有效但机制不同。
  • 面试题:AntiSamy的命名来源?答:反对Samy(MySpace首个XSS蠕虫作者)。
  • 面试题:三种方案能否组合?答:可以,依据数据载体(纯文本/HTML/JSON/Script)灵活选择。
  • 难点:生产环境中防护通常部署在流量网关,演示中用自定义Filter替代以简化场景。

五、 课后疑问/遗留问题

  • 自定义 antisamy.xml 规则文件如何编写?如何针对富文本场景做精细化白名单配置?
  • 半角转全角方案对业务语义是否有副作用(如用户确实需要输入 < > 符号)?如何兼顾可用性?
  • XSS防护的另外三种策略(输出编码、CSP、HttpOnly Cookie)将在后续课程展开。
  • AntiSamy与OWASP Java Encoder(Encoder)的区别与选型?
最近更新: 2026/6/23 17:18
Contributors: yangwenguang
Prev
课程笔记:XSS攻击的防护策略
Next
课程笔记:XSS 劫持 Cookie 的防护策略