如何在 Excel 单元格中将 HTML 转换为文本?
您是否曾经尝试过在 Excel 中将 HTML 文本转换为纯文本?如果我们尝试手动完成此操作,则可能是一个耗时且不准确的过程。HTML 文本和普通文本之间的区别在于,HTML 文本具有页眉和页脚,这些页眉和页脚在 "< >" 内表示。如果从 HTML 中删除这些文本,则它们将被视为纯文本。在本文中,我们将学习如何在 Excel 单元格中将 HTML 转换为文本。在本教程中,我们将使用 VBA 应用程序来完成此任务。
将 HTML 转换为单元格中的文本
在这里,我们将首先创建一个 VBA 模块,启用引用,然后运行代码以完成该过程。让我们看一下在 Excel 单元格中将 html 转换为文本的简单过程。
步骤 1
让我们考虑一个 Excel 表格,其中数据是 HTML 列表,类似于下图。
现在右键单击工作表名称并选择“查看代码”以打开 VBA 应用程序,然后单击“插入”并选择“模块”。
右键单击 > 查看代码 > 插入 > 模块
步骤 2
然后将下面提到的程序输入到文本框中,如下图所示。
程序
Sub RemoveHTMLTags() 'Updated By Nirmal Dim xRg As Range Dim xCell As Range Dim xStr As String Dim xRegEx As RegExp Dim xMatch As Match Dim xMatches As MatchCollection Set xRegEx = New RegExp Application.EnableEvents = False Set xRg = Cells.SpecialCells(xlCellTypeConstants) With xRegEx .Global = True .Pattern = "<(""[^""]*""|'[^']*'|[^'"">])*>" End With For Each xCell In xRg xStr = xCell.Value Set xMatches = xRegEx.Execute(xCell.Text) For Each xMatch In xMatches xStr = Replace(xStr, xMatch.Value, "") Next xCell.Value = xStr Next Application.EnableEvents = True End Sub
步骤 3
然后,在 VBA 应用程序中,单击“工具”,选择“引用”,选中名为“Microsoft VBScript 正则表达式”的复选框,然后单击“确定”。
工具 > 引用 > 复选框 > 确定
步骤 4
然后将工作簿另存为启用宏的工作簿,然后单击 F5 运行代码,我们的结果将类似于下图。
结论
在本教程中,我们使用了一个简单的示例来演示如何将 HTML 转换为 Excel 中的普通文本。
广告