如何在 Excel 单元格中将 HTML 转换为文本?


您是否曾经尝试过在 Excel 中将 HTML 文本转换为纯文本?如果我们尝试手动完成此操作,则可能是一个耗时且不准确的过程。HTML 文本和普通文本之间的区别在于,HTML 文本具有页眉和页脚,这些页眉和页脚在 "< >" 内表示。如果从 HTML 中删除这些文本,则它们将被视为纯文本。在本文中,我们将学习如何在 Excel 单元格中将 HTML 转换为文本。在本教程中,我们将使用 VBA 应用程序来完成此任务。

将 HTML 转换为单元格中的文本

在这里,我们将首先创建一个 VBA 模块,启用引用,然后运行代码以完成该过程。让我们看一下在 Excel 单元格中将 html 转换为文本的简单过程。

步骤 1

让我们考虑一个 Excel 表格,其中数据是 HTML 列表,类似于下图。

现在右键单击工作表名称并选择“查看代码”以打开 VBA 应用程序,然后单击“插入”并选择“模块”。

右键单击 > 查看代码 > 插入 > 模块

步骤 2

然后将下面提到的程序输入到文本框中,如下图所示。

程序

Sub RemoveHTMLTags()
'Updated By Nirmal
    Dim xRg As Range
    Dim xCell As Range
    Dim xStr As String
    Dim xRegEx As RegExp
    Dim xMatch As Match
    Dim xMatches As MatchCollection
    Set xRegEx = New RegExp
    Application.EnableEvents = False
    Set xRg = Cells.SpecialCells(xlCellTypeConstants)
    With xRegEx
        .Global = True
        .Pattern = "<(""[^""]*""|'[^']*'|[^'"">])*>"
    End With
    For Each xCell In xRg
        xStr = xCell.Value
            Set xMatches = xRegEx.Execute(xCell.Text)
            For Each xMatch In xMatches
                xStr = Replace(xStr, xMatch.Value, "")
            Next
        xCell.Value = xStr
    Next
   Application.EnableEvents = True
End Sub

步骤 3

然后,在 VBA 应用程序中,单击“工具”,选择“引用”,选中名为“Microsoft VBScript 正则表达式”的复选框,然后单击“确定”。

工具 > 引用 > 复选框 > 确定

步骤 4

然后将工作簿另存为启用宏的工作簿,然后单击 F5 运行代码,我们的结果将类似于下图。

结论

在本教程中,我们使用了一个简单的示例来演示如何将 HTML 转换为 Excel 中的普通文本。

更新于: 2023-03-06

6K+ 次查看

启动您的 职业生涯

通过完成课程获得认证

立即开始
广告