- Jsoup 教程
- jsoup - 主页
- jsoup - 概述
- jsoup - 环境设置
- 示例 - 输入
- jsoup - 解析字符串
- jsoup - 解析正文
- jsoup - 加载 URL
- jsoup - 加载文件
- 示例 - 提取数据
- jsoup - 使用 DOM 方法
- jsoup - 使用选择器语法
- jsoup - 提取属性
- jsoup - 提取文本
- jsoup - 提取 HTML
- jsoup - 使用 URL
- 示例 - 修改数据
- jsoup - 设置属性
- jsoup - 设置 HTML
- jsoup - 设置文本内容
- 示例 - 清除 HTML
- jsoup - 清除 HTML
- jsoup 有用资源
- jsoup - 快速指南
- jsoup - 有用资源
- jsoup - 讨论
jsoup - 提取文本
以下示例将展示使用在解析 HTML 字符串为 Document 对象后获取文本的方法。
语法
Document document = Jsoup.parse(html); Element link = document.select("a").first(); System.out.println("Text: " + link.text());
其中
document − document 对象表示 HTML DOM。
Jsoup − 解析给定的 HTML 字符串的主类。
html − HTML 字符串。
link − 元素对象表示代表锚定标记的 HTML 节点元素。
link.text() − text() 方法检索元素文本。
说明
Element 对象表示 DOM 元素,并提供各种方法以获取 DOM 元素的文本。
示例
在 C:/> jsoup 中使用任意编辑器创建以下 Java 程序。
JsoupTester.java
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupTester { public static void main(String[] args) { String html = "<html><head><title>Sample Title</title></head>" + "<body>" + "<p>Sample Content</p>" + "<div id='sampleDiv'><a href='www.google.com'>Google</a>" + "<h3><a>Sample</a><h3>" +"</div>" +"</body></html>"; Document document = Jsoup.parse(html); //a with href Element link = document.select("a").first(); System.out.println("Text: " + link.text()); } }
验证结果
使用 javac 编译器如下编译该类
C:\jsoup>javac JsoupTester.java
现在运行 JsoupTester 以查看结果。
C:\jsoup>java JsoupTester
查看结果。
Text: Google
广告