jsoup - 通过 URL 加载



下面的示例将展示如何使用 url 从网络获取 HTML,然后查找其数据。

语法

String url = "http://www.google.com";
Document document = Jsoup.connect(url).get();

其中

  • document − document 对象表示 HTML DOM。

  • Jsoup − 连接 url 并获取 HTML 字符串的主要类。

  • url − 要加载的 html 页面的 url。

说明

connect(url) 方法建立到 url 的连接,而 get() 方法返回所请求 url 的 html。

示例

在任意编辑器中使用任何编辑器在 C:/>jsoup 中创建以下 java 程序。

JsoupTester.java

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class JsoupTester {
   public static void main(String[] args) throws IOException {
   
      String url = "http://www.google.com";
      Document document = Jsoup.connect(url).get();
      System.out.println(document.title());
   }
}

验证结果

使用以下 javac 编译器编译该类

C:\jsoup>javac JsoupTester.java

现在运行 JsoupTester 以查看结果。

C:\jsoup>java JsoupTester

查看结果。

Google
广告