如何使用 Selenium 获取带有 javascript 渲染源代码的 html?
我们可以使用 Selenium webdriver 获取带有 JavaScript 渲染源代码的 HTML。Selenium 可以借助 executeScript 方法来执行 JavaScript 命令。
要执行的 JavaScript 命令作为参数传递给该方法。要通过 JavaScript 获取 HTML,我们将 return document.getElementsByTagName('html')[0].innerHTML 作为参数传递给 executeScript 方法。
语法
JavascriptExecutor j = (JavascriptExecutor) driver; String s = (String) j.executeScript (return document.getElementsByTagName('html')[0].innerHTML");
示例
import org.openqa.selenium.WebDriver; import org.openqa.selenium.chrome.ChromeDriver; import org.openqa.selenium.JavascriptExecutor; import org.openqa.selenium.WebElement; import org.openqa.selenium.By; public class HTmlSrcJS{ public static void main(String[] args) { System.setProperty("webdriver.chrome.driver", "C:\Users\ghs6kor\Desktop\Java\chromedriver.exe"); WebDriver driver = new ChromeDriver(); driver.get("https://tutorialspoint.com/index.htm "); //Javascript Executor JavascriptExecutor j = (JavascriptExecutor) driver; String s = (String) j.executeScript (return document.getElementsByTagName('html')[0].innerHTML"); System.out.println(s); driver.quit(); } }
要通过 JavaScript 获取 HTML,我们还可以将 return document.body.innerHTML 作为参数传递给 executeScript 方法。
语法
JavascriptExecutor j = (JavascriptExecutor) driver; String s = (String) j.executeScript (return document.body.innerHTML");
示例
import org.openqa.selenium.WebDriver; import org.openqa.selenium.chrome.ChromeDriver; import org.openqa.selenium.JavascriptExecutor; import org.openqa.selenium.WebElement; import org.openqa.selenium.By; public class HTmlSrcBodyJS{ public static void main(String[] args) { System.setProperty("webdriver.chrome.driver", "C:\Users\ghs6kor\Desktop\Java\chromedriver.exe"); WebDriver driver = new ChromeDriver(); driver.get("https://tutorialspoint.com/index.htm "); //Javascript Executor JavascriptExecutor j = (JavascriptExecutor) driver; String s = (String) j.executeScript (return document.body.innerHTML"); System.out.println(s); driver.quit(); } }
广告