如何在 Java 中从给定的字符串中删除 HTML 标记?
**String **是 Java 中的一个**最终类**,并且它**不可变**,这意味着我们不能够更改对象本身,但我们可以更改对该对象的引用。可以使用 String 类的**replaceAll()** 方法来从给定字符串中移除 HTML 标记。我们可以使用**正则表达式**来从给定的字符串中移除 HTML 标记。在从字符串中移除 HTML 标记之后,它将返回一个正常的文本字符串。
语法
public String replaceAll(String regex, String replacement)
示例
public class RemoveHTMLTagsTest { public static void main(String[] args) { String str = "<p><b>Welcome to Tutorials Point</b></p>"; System.out.println("Before removing HTML Tags: " + str); str = str.replaceAll("\<.*?\>", ""); System.out.println("After removing HTML Tags: " + str); } }
输出
Before removing HTML Tags: <p><b>Welcome to Tutorials Point</b></p> After removing HTML Tags: Welcome to Tutorials Point
广告