如何使用 JavaScript 从字符串中去除 HTML 标记?


我们可以使用以下示例通过 JavaScript 从字符串中去除 HTML 标记 -

  • 使用 Regex 去除 HTML 标记
  • 使用 innerText 去除 HTML 标记

使用 Regex 去除 HTML 标记

regex 将识别 HTML 标记,然后使用 replace() 将标记替换为空字符串。让我们来看以下 HTML -

<html><head></head><body><p>The tags stripped...<p</body></html> 

我们希望使用正则表达式来移除以上标记。为此,我们将创建一个自定义函数 -

function removeTags(myStr) 

myStr 将包含我们要从中移除标记的 HTML 代码 -

function removeTags(myStr) { if ((myStr===null) || (myStr==='')) return false; else myStr = myStr.toString(); return myStr.replace( /(<([^>]+)>)/ig, ''); }

要调用上面去除标记的函数,请像这样 -

document.write(removeTags('<html><head></head><body><p>The tags stripped...<p</body></html>'));;

现在让我们来看一个完整的示例 -

<!DOCTYPE html> <html> <title>Strip HTML Tags</title> <head> <script> function removeTags(myStr) { if ((myStr===null) || (myStr==='')) return false; else myStr = myStr.toString(); return myStr.replace( /(<([^>]+)>)/ig, ''); } document.write(removeTags( '<html><head></head><body><p>The tags stripped...<p</body></html>'));; </script> </head> <body> </body> </html>

输出

使用 innerText 去除 HTML 标记

在本例中,我们将使用 innerText 去除 HTML 标记 -

<!DOCTYPE html> <html> <title>Strip HTML Tags</title> <head> <script> var html = "<html><head></head><body><p>The tags stripped...<p</body></html>"; var div = document.createElement("div"); div.innerHTML = html; var text = div.textContent || div.innerText || ""; document.write(text) </script> </head> <body> </body> </html>

输出

更新于: 2022-11-22

741 次浏览

开启您的 职业

通过完成课程取得认证

开始
广告