使用 Python Selenium 访问 HTML 源代码。


我们可以使用 Selenium webdriver 访问 HTML 源代码。我们可以借助 **page_source** 方法,并将其获取的值在控制台中打印出来。

语法

src = driver.page_source

我们还可以借助 Selenium 中的 Javascript 命令访问 HTML 源代码。我们将借助 **execute_script** 方法,并将命令 **return document.body.innerHTML** 作为参数传递给该方法。

语法

h = driver.execute_script("return document.body.innerHTML;")

示例

代码实现。

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.com/index.htm")
# access HTML source code with page_source method
s = driver.page_source
print(s)

使用 Javascript 执行器的代码实现。

from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.com/index.htm")
# access HTML source code with Javascript command
h = driver.execute_script("return document.body.innerHTML")
print(h)

更新时间:26-10-2020

3K+ 浏览

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告