- Jsoup 教程
- jsoup——主页
- jsoup——概述
- jsoup——环境设置
- 示例——输入
- jsoup——分析字符串
- jsoup——分析主体
- jsoup——加载 URL
- jsoup——加载文件
- 示例——提取数据
- jsoup——使用 DOM 方法
- jsoup——使用选择器语法
- jsoup——提取属性
- jsoup——提取文本
- jsoup——提取 HTML
- jsoup——使用 URL
- 示例——修改数据
- jsoup——设置属性
- jsoup——设置 HTML
- jsoup——设置文本内容
- 示例——清理 HTML
- jsoup——消毒 HTML
- jsoup 有用资源
- jsoup——快速指南
- jsoup——有用资源
- jsoup——讨论
jsoup——概述
jsoup 是一个基于 Java 的库,用于处理基于 HTML 的内容。它提供了一个非常方便的 API,可以使用 DOM、CSS 和类似 jquery 的方法来提取和操作数据。它实现 WHATWG HTML5 规范,并将 HTML 解析为与现代浏览器相同的 DOM。
jsoup 库实现 WHATWG HTML5 规范,并将 HTML 内容解析为与现代浏览器相同的 DOM。
jsonp 库提供以下功能。
支持多种读取 − 它使用 URL、文件或字符串来读取和分析 HTML。
CSS 选择器 − 它可以使用 DOM 遍历或 CSS 选择器来查找和提取数据。
DOM 操作 − 它可以操作 HTML 元素、属性和文本。
防止 XSS 攻击 − 它可以根据给定的安全白名单来清理用户提交的内容,以防止 XSS 攻击。
Tidy − 它输出整洁的 HTML。
处理无效数据 − jsoup 可以处理未闭合标签、隐式标签,并且可以可靠地创建文档结构。
广告