PHP去除HTML标签的方法详解：strip_tags与正则表达式应用

M66 2025-07-26

在Web开发过程中，我们常常需要处理包含HTML标签的字符串，例如用户提交的内容、富文本编辑器输出的数据等。为了提取纯文本内容，PHP提供了便捷的函数和方法来实现HTML标签的去除。本文将介绍两种主流方式，帮助开发者轻松实现这一需求。

PHP内置的 strip_tags() 函数可以有效地去除字符串中的HTML标签。其语法简单，执行效率高，是处理简单HTML清洗任务的理想选择。


$string = "<p>这是包含HTML标签的字符串。</p>";
$clean_string = strip_tags($string);
echo $clean_string;

输出结果：

这是包含HTML标签的字符串。

strip_tags() 的第一个参数是需要处理的字符串，第二个可选参数用于指定允许保留的HTML标签。例如：


$string = "<p>段落</p><a href='#'>链接</a>";
$clean_string = strip_tags($string, '<a>');
echo $clean_string;


$string = "<div>这是<div>包含HTML标签</div>的字符串。</div>";
$clean_string = preg_replace("/<.*?>/", "", $string);
echo $clean_string;

输出结果：

这是包含HTML标签的字符串。

该正则表达式 /<.*?>/ 匹配所有的HTML标签，并将其替换为空字符串。这种方式适合处理结构较复杂或包含自定义标签的内容。

通过 strip_tags() 或正则表达式，PHP开发者可以根据实际需求灵活选择去除HTML标签的方式。前者适合处理简单、可控的HTML内容，后者则适用于需要更高灵活性和复杂结构处理的场景。掌握这些方法，有助于提升Web应用的数据处理能力和用户体验。