当前位置: 首页> 最新文章列表> 如何在 xml_parse 中使用递归解析嵌套 XML 文档

如何在 xml_parse 中使用递归解析嵌套 XML 文档

M66 2025-05-12

在 PHP 中处理 XML 文档时,xml_parse() 是一个低层级但强大的函数。它依赖事件驱动的解析模型,因此你需要注册相应的回调函数来响应文档的开始、结束以及字符数据。

然而,面对嵌套结构复杂的 XML 文档,使用递归可以让数据处理变得更直观且结构清晰。本文将介绍如何结合递归与 xml_parse() 来解析嵌套的 XML 数据。

一、示例 XML 数据

<catalog>
    <book id="1">
        <title>PHP Basics</title>
        <author>John Doe</author>
    </book>
    <book id="2">
        <title>Advanced PHP</title>
        <author>Jane Smith</author>
    </book>
</catalog>

二、创建解析器并设置处理函数

我们首先需要创建一个解析器,并设置三种回调函数:

  • startElement():当解析器遇到一个开始标签时调用;

  • endElement():当解析器遇到一个结束标签时调用;

  • characterData():当解析器遇到标签中的文本时调用。

三、实现递归结构的关键:构建树状数组

下面是完整代码示例:

<?php

$xml = <<<XML
<catalog>
    <book id="1">
        <title>PHP Basics</title>
        <author>John Doe</author>
    </book>
    <book id="2">
        <title>Advanced PHP</title>
        <author>Jane Smith</author>
    </book>
</catalog>
XML;

$parser = xml_parser_create();
$dataStack = [];
$currentData = null;

// 开始标签
function startElement($parser, $name, $attrs) {
    global $dataStack, $currentData;

    $element = [
        'tag' => $name,
        'attributes' => $attrs,
        'children' => [],
        'value' => ''
    ];

    if ($currentData !== null) {
        array_push($dataStack, $currentData);
    }

    $currentData = $element;
}

// 结束标签
function endElement($parser, $name) {
    global $dataStack, $currentData;

    if (!empty($dataStack)) {
        $parent = array_pop($dataStack);
        $parent['children'][] = $currentData;
        $currentData = $parent;
    }
}

// 文本内容
function characterData($parser, $data) {
    global $currentData;

    if (isset($currentData['value'])) {
        $currentData['value'] .= trim($data);
    }
}

xml_set_element_handler($parser, "startElement", "endElement");
xml_set_character_data_handler($parser, "characterData");

if (!xml_parse($parser, $xml, true)) {
    die(sprintf("XML 错误: %s 在第 %d 行",
        xml_error_string(xml_get_error_code($parser)),
        xml_get_current_line_number($parser)));
}

xml_parser_free($parser);

// 打印最终结构
print_r($currentData);
?>

四、输出结构说明

解析后,你将得到一个嵌套的数组结构,类似以下内容:

Array
(
    [tag] => CATALOG
    [attributes] => Array()
    [children] => Array
        (
            [0] => Array
                (
                    [tag] => BOOK
                    [attributes] => Array ( [ID] => 1 )
                    [children] => Array
                        (
                            [0] => Array ( [tag] => TITLE [value] => PHP Basics )
                            [1] => Array ( [tag] => AUTHOR [value] => John Doe )
                        )
                )
            [1] => Array
                (
                    [tag] => BOOK
                    [attributes] => Array ( [ID] => 2 )
                    [children] => Array
                        (
                            [0] => Array ( [tag] => TITLE [value] => Advanced PHP )
                            [1] => Array ( [tag] => AUTHOR [value] => Jane Smith )
                        )
                )
        )
)

五、将解析结构转换为 JSON 或其他格式

你可以轻松地将上面的数组结构转换为 JSON,以供前端调用或接口输出:

echo json_encode($currentData, JSON_PRETTY_PRINT);

六、小贴士

  • 如果 XML 文档来源于网络,比如 https://m66.net/data/books.xml,你可以使用 file_get_contents() 获取: