Puppeteer - XPath 轴



为了唯一地确定一个元素,我们可以利用html标签内的任何属性,或者使用html标签上属性的组合。大多数情况下使用id属性,因为它在页面中是唯一的。

但是,如果id属性不存在,我们可以使用其他属性,例如class、name等等。如果id、name和class等属性不存在,我们可以利用仅该标签可用的独特属性或属性及其值的组合来识别元素。

为此,我们必须使用xpath表达式。此外,如果页面上的元素是动态的,那么xpath选择器可以作为选择器的一个不错的选择。

xpath是双向的,这意味着我们可以从父元素遍历到子元素,也可以从子元素遍历到父元素。xpath轴的详细信息将在下面的链接中提供:

https://tutorialspoint.com/xpath/xpath_axes.htm

在下图中,让我们识别高亮的编辑框并获取其class属性的值 - gsc-input。

Highlighted Edit Box

在上面的例子中,表格中(由tr标签表示)有两列(由td标签表示)。输入框位于第一列。

所以xpath表达式如下:

//table/tbody/tr/child::td.

在这里,我们使用的是xpath选择器,所以我们必须使用该方法:page.$x(xpath value)。此方法的详细信息在Puppeteer定位器章节中讨论。

首先,请按照Puppeteer基本测试章节中的步骤1到2进行操作,步骤如下:

步骤1 - 在创建node_modules文件夹的目录(Puppeteer和Puppeteer核心已安装的位置)中创建一个新文件。

Puppeteer安装的详细信息在Puppeteer安装章节中讨论。

右键单击创建node_modules文件夹的文件夹,然后单击“新建文件”按钮。

Node Modules

步骤2 - 输入文件名,例如testcase1.js。

Testcase1.JS

步骤3 - 在创建的testcase1.js文件中添加以下代码。

//Puppeteer library
const pt= require('puppeteer')
async function selectorAxesXpath(){
   //launch browser in headless mode
   const browser = await pt.launch()
   //browser new page
   const page = await browser.newPage()
   //launch URL
   await page.goto('https://tutorialspoint.com/index.htm')
   //identify element with xpath axes
   const n = (await page.$x("//table/tbody/tr/child::td"))[0]
   // get value of class attribute
   let v = await page.$eval("input", n => n.getAttribute("class"))
   console.log(v)
}
selectorAxesXpath()

步骤4 - 使用以下命令执行代码:

node <filename>

所以在我们的例子中,我们将运行以下命令:

node testcase1.js
node_testcase1.jpg

命令成功执行后,元素的class属性值 - gsc-input 将打印在控制台中。

广告