如何使用mb_eregi_replace函数结合htmlspecialchars()实现XSS防护，替换前做好安全处理？

M66 2025-06-02

在Web开发中，XSS（跨站脚本攻击）是一种常见且危险的安全漏洞。攻击者通过注入恶意脚本代码，使用户在浏览网页时执行了攻击者设计的代码，从而窃取敏感信息、劫持会话或篡改页面内容。为了防止XSS攻击，开发者需要对用户输入或动态内容进行严格的过滤和转义处理。

本文将介绍如何利用PHP中的mb_eregi_replace()函数结合htmlspecialchars()函数，实现对用户输入的安全替换和输出，达到防护XSS攻击的目的，并在替换操作前做好安全处理。

一、XSS攻击及防护的基础

XSS攻击主要发生在浏览器端，攻击者将恶意脚本嵌入页面，浏览器执行后导致攻击。防护的关键在于对用户输入内容的过滤和转义。

过滤：移除或替换危险的标签、属性和脚本。
转义：将特殊HTML字符转义成实体，防止浏览器将其当成代码执行。

PHP的htmlspecialchars()函数是防止XSS的常用手段，它会将< > " ' &等字符转换为对应的HTML实体，从而使浏览器以普通文本展示，而非执行代码。

二、mb_eregi_replace函数简介

mb_eregi_replace()是PHP中多字节字符串安全的正则替换函数，支持不区分大小写的正则匹配，适合处理含有中文等多字节字符的字符串。

语法：

mb_eregi_replace($pattern, $replacement, $string);

它可用于匹配并替换字符串中敏感词或危险内容，是进行内容过滤的利器。

三、结合mb_eregi_replace和htmlspecialchars实现XSS防护

先使用htmlspecialchars()转义输入字符串
这样可以防止恶意的HTML或JS代码被浏览器直接执行。
再用mb_eregi_replace()对敏感词或危险标签进行过滤或替换
例如，将<script>标签替换为安全文本，避免攻击脚本残留。
输出安全处理后的内容，防止任何注入。

四、示例代码

<?php
// 用户输入内容，可能包含恶意脚本
$input = '<script>alert("XSS攻击")</script><b>正常文本</b>';

// 第一步：先转义HTML特殊字符，防止浏览器执行脚本
$safe_input = htmlspecialchars($input, ENT_QUOTES, 'UTF-8');

// 第二步：替换敏感词或标签，这里以<script>为例，替换为“[被禁止标签]”
$pattern = '<script.*?>.*?</script>';
$replacement = '[被禁止标签]';

// 使用mb_eregi_replace替换敏感标签，忽略大小写
$filtered_input = mb_eregi_replace($pattern, $replacement, $safe_input);

// 输出处理后的内容
echo $filtered_input;
?>

代码说明：

htmlspecialchars()将<、>等符号转义成实体，防止脚本执行。
mb_eregi_replace()用来匹配<script>标签，忽略大小写替换为提示文本。
这样，即使输入中含有复杂的大小写混合标签，也能安全过滤。

五、注意事项

替换时的正则表达式需足够严谨，防止绕过。
过滤并非万能，结合白名单策略和内容安全策略（CSP）效果更佳。
对不同环境（HTML、JavaScript、URL等）的输出，需做对应的安全转义。
mb_eregi_replace()适合多字节环境，避免乱码。

六、总结

通过先对用户输入使用htmlspecialchars()进行转义，接着利用mb_eregi_replace()函数对可能的恶意脚本标签进行替换，可以有效提升PHP应用的XSS防护能力。在实际项目中，这样的多层安全处理能够大幅降低安全风险，保护用户数据和系统安全。

示例代码中涉及的URL域名示范：

$url = "https://m66.net/path/to/resource";
echo "<a href=\"$url\">安全链接</a>";