使用 Python Selenium 访问 HTML 源代码。
我们可以使用 Selenium webdriver 访问 HTML 源代码。我们可以借助 **page_source** 方法,并将其获取的值在控制台中打印出来。
语法
src = driver.page_source
我们还可以借助 Selenium 中的 Javascript 命令访问 HTML 源代码。我们将借助 **execute_script** 方法,并将命令 **return document.body.innerHTML** 作为参数传递给该方法。
语法
h = driver.execute_script("return document.body.innerHTML;")
示例
代码实现。
from selenium import webdriver driver = webdriver.Chrome(executable_path="C:\chromedriver.exe") driver.implicitly_wait(0.5) driver.get("https://tutorialspoint.com/index.htm") # access HTML source code with page_source method s = driver.page_source print(s)
使用 Javascript 执行器的代码实现。
from selenium import webdriver driver = webdriver.Chrome(executable_path="C:\chromedriver.exe") driver.implicitly_wait(0.5) driver.get("https://tutorialspoint.com/index.htm") # access HTML source code with Javascript command h = driver.execute_script("return document.body.innerHTML") print(h)
广告