如何在 Selenium 和 Python 中根据工作表中的条件获取特定列的所有值?
我们可以在 Selenium 中根据工作表中的条件获取特定列的所有值。Excel 是一种电子表格,以 .xlsx 扩展名保存。一个 Excel 工作簿包含多个工作表,每个工作表由行和列组成。
在所有工作表中,当我们访问一个特定工作表时,它被称为活动工作表。工作表中的每个单元格都有一个唯一的地址,它是行号和列号的组合。
列号从字母字符 A 开始,行号从数字 1 开始。单元格可以包含多种类型的值,它们是工作表的主要组成部分。
要在 Selenium 和 Python 中使用 Excel,我们需要借助 OpenPyXL 库。此库负责 Excel 的读写操作,其扩展名包括 xlsx、xlsm、xltm、xltx。
要安装 OpenPyXL 库,我们必须执行命令 **pip install openpyxl**。这是因为 OpenPyXL 不是 Python 的默认库。之后,我们应该在代码中 **import openpyxl**,然后我们就可以与 Excel 交互了。
要获取特定列的值,首先我们需要通过指定其所在路径加载整个工作簿。这是通过 load_workbook() 方法实现的。接下来,我们需要借助 active 方法识别所有工作表中的活动工作表。
接下来,我们需要使用 max_row 方法,该方法提供已占用行的数量。请注意,此方法应与工作表级对象一起使用。
并且我们需要使用 max_column 方法,该方法提供已占用列的数量。请注意,此方法应与工作表级对象一起使用。
我们需要从 1 迭代到已占用最大行数,以遍历所有行。假设我们的期望值位于第 1 列。因此,我们需要检查该值是否存在。
如果该值存在,我们需要从 1 迭代到已占用最大列数,以遍历所有列。
最后,要检索该特定列中的所有值,我们需要借助行号、列号和 cell 方法[它接受行号和列号作为参数]。例如,要指向对应于第 2 行和第 3 列的单元格,我们需要指定 sheet.cell(row=2,column=3)。
语法
wrkbk = load_workbook("C:\work\SeleniumPython.xlsx")
# to identify the active sheet
sh = wrkbk.active
# identify the number of occupied rows
sh.max_row
# identify the number of occupied rows
sh.max_column示例
获取特定列所有值的代码实现。
import openpyxl
# load excel with its path
wrkbk = load_workbook("C:\work\SeleniumPython.xlsx")
# to get the active work sheet
sh = wrkbk.active
# to print the maximum number of occupied rows in console
print(sh.max_row)
# to print the maximum number of occupied columns in console
print(sh.max_column)
# to get all the values from the excel and traverse through the rows
for r in range(1,max_row+1):
# to traverse through the columns
for c in range(i,max_column+1):
# to check the value in row 1
if(sh.cell(row=1, column=c).value == "Tutorial":
# to get all the values
print(sh.cell(row=r, column=c).value)我们引用的 Excel 数据 -

数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP