如何在 Java 中从给定的字符串中删除 HTML 标记?


**String **是 Java 中的一个**最终类**,并且它**不可变**,这意味着我们不能够更改对象本身,但我们可以更改对该对象的引用。可以使用 String 类的**replaceAll()** 方法来从给定字符串中移除 HTML 标记。我们可以使用**正则表达式**来从给定的字符串中移除 HTML 标记。在从字符串中移除 HTML 标记之后,它将返回一个正常的文本字符串。

语法

public String replaceAll(String regex, String replacement)

示例

public class RemoveHTMLTagsTest {
   public static void main(String[] args) {
      String str = "<p><b>Welcome to Tutorials Point</b></p>";
      System.out.println("Before removing HTML Tags: " + str);
      str = str.replaceAll("\<.*?\>", "");
      System.out.println("After removing HTML Tags: " + str);
   }
}

输出

Before removing HTML Tags: <p><b>Welcome to Tutorials Point</b></p>
After removing HTML Tags: Welcome to Tutorials Point

更新时间: 2020 年 7 月 1 日

19K+ 次浏览量

开启你的 职业生涯

完成课程认证

开始
广告