- Jsoup 教程
- jsoup —— 主页
- jsoup —— 概述
- jsoup —— 环境设置
- 示例 —— 输入
- jsoup —— 解析字符串
- jsoup —— 解析正文
- jsoup —— 加载 URL
- jsoup —— 加载文件
- 示例 —— 提取数据
- jsoup —— 使用 DOM 方法
- jsoup —— 使用选择器语法
- jsoup —— 提取属性
- jsoup —— 提取文本
- jsoup —— 提取 HTML
- jsoup —— 使用 URL
- 示例 —— 修改数据
- jsoup —— 设置属性
- jsoup —— 设置 HTML
- jsoup —— 设置文本内容
- 示例 —— 清理 HTML
- jsoup —— 过滤 HTML
- jsoup 实用资源
- jsoup —— 快速指南
- jsoup —— 实用资源
- jsoup —— 讨论
jsoup —— 过滤 HTML
以下示例将展示如何预防 XSS 攻击或跨站点脚本攻击。
语法
String safeHtml = Jsoup.clean(html, Safelist.basic());
其中
Jsoup —— 解析给定 HTML 字符串的主类。
html —— 初始 HTML 字符串。
safeHtml —— 已清理的 HTML。
Safelist —— 提供默认配置以保护 html 的对象。
clean() —— 使用白名单清理 html。
说明
Jsoup 对象使用白名单配置过滤 html。
示例
使用任意编辑器(例如 C:/> jsoup)创建以下 Java 程序。
JsoupTester.java
import org.jsoup.Jsoup; import org.jsoup.safety.Safelist; public class JsoupTester { public static void main(String[] args) { String html = "<p><a href='http://example.com/'" +" onclick='checkData()'>Link</a></p>"; System.out.println("Initial HTML: " + html); String safeHtml = Jsoup.clean(html, Safelist.basic()); System.out.println("Cleaned HTML: " +safeHtml); } }
验证结果
使用 javac 编译器编译该类,如下所示 −
C:\jsoup>javac JsoupTester.java
现在运行 JsoupTester 以查看结果。
C:\jsoup>java JsoupTester
查看结果。
Initial HTML: <p><a href='http://example.com/' onclick='checkData()'>Link</a></p> Cleaned HTML: <p><a href="http://example.com/" rel="nofollow">Link</a></p>
广告