使用 Python Selenium 访问 HTML 源代码。
我们可以使用 Selenium webdriver 访问 HTML 源代码。我们可以借助 **page_source** 方法,并将其获取的值在控制台中打印出来。
语法
src = driver.page_source
我们还可以借助 Selenium 中的 Javascript 命令访问 HTML 源代码。我们将借助 **execute_script** 方法,并将命令 **return document.body.innerHTML** 作为参数传递给该方法。
语法
h = driver.execute_script("return document.body.innerHTML;")示例
代码实现。
from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.com/index.htm")
# access HTML source code with page_source method
s = driver.page_source
print(s)使用 Javascript 执行器的代码实现。
from selenium import webdriver
driver = webdriver.Chrome(executable_path="C:\chromedriver.exe")
driver.implicitly_wait(0.5)
driver.get("https://tutorialspoint.com/index.htm")
# access HTML source code with Javascript command
h = driver.execute_script("return document.body.innerHTML")
print(h)
广告
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP