Puppeteer - XPath 函数



为了唯一地确定一个元素,我们可以借助 html 标签中的任何属性,或者使用 html 标签上属性的组合。大多数情况下使用 id 属性,因为它在页面中是唯一的。

但是,如果不存在 id 属性,我们可以使用其他属性,例如 class、name 等。如果不存在 id、name 和 class 等属性,我们可以利用仅对该标签可用的唯一属性或属性及其值的组合来识别元素。为此,我们必须使用 xpath 表达式。

如果元素存在重复的属性或没有属性,则使用函数 text() 来识别元素。为了使用 text() 函数,该元素必须在页面上显示可见的文本。

语法

使用 text() 函数的语法如下:

//tagname[text()='visible text on element']

如果元素的值或文本部分是动态的或非常长,我们可以使用 contains() 函数。为了使用 contains() 函数,该元素必须具有属性值或文本。

语法

使用 contains() 函数的语法如下:

//tagname[contains(@attribute,'value')]
//tagname[contains(text(),'visible text on element')]

如果元素的文本以特定文本开头,我们可以使用 starts-with() 函数。

语法

使用 starts-with() 函数的语法如下:

//tagname[starts-with(text(),'visible text on element')

在以上所有函数中,tagname 是可选的。我们可以使用符号 * 代替 tagname。

在下图中,让我们借助其显示的文本识别元素 - 图书馆,然后单击它。

Library

该元素的 xpath 将为 //*[text()='Library']。

这里,我们使用 xpath 选择器,因此必须使用方法:page.$x(xpath 值)。有关此方法的详细信息在章节 - Puppeteer 定位器中讨论。

首先,请按照 Puppeteer 上基本测试章节中的步骤 1 到 2 操作,步骤如下:

步骤 1 - 在创建 node_modules 文件夹的目录(Puppeteer 和 Puppeteer 核心已安装的位置)中创建一个新文件。

有关 Puppeteer 安装的详细信息在 Puppeteer 安装章节中讨论。

右键单击创建 node_modules 文件夹的文件夹,然后单击“新建文件”按钮。

Node Modules

步骤 2 - 输入文件名,例如 testcase1.js。

Testcase1.JS

步骤 3 - 在创建的 testcase1.js 文件中添加以下代码。

//Puppeteer library
const pt= require('puppeteer')
async function selectorFunTextXpath(){
   //launch browser in headless mode
   const browser = await pt.launch()
   //browser new page
   const page = await browser.newPage()
   //launch URL
   await page.goto('https://tutorialspoint.com/index.htm')
   //identify element with xpath function - text() then click
   const b = (await page.$x("//*[text()='Library']"))[0]
   b.click()
   //wait for sometime
   await page.waitForTimeout(4000)
   //obtain URL after click
   console.log(await page.url())
}
selectorFunTextXpath()

步骤 4 - 使用以下命令执行代码:

node <filename>

因此,在我们的示例中,我们将运行以下命令:

node testcase1.js
Testcase

成功执行命令后,单击元素“图书馆”后导航到的页面的 URL - https://tutorialspoint.com/tutorialslibrary.htm 将打印到控制台中。

广告