在 PHP 中处理 XML 文档时,xml_parse() 是一个低层级但强大的函数。它依赖事件驱动的解析模型,因此你需要注册相应的回调函数来响应文档的开始、结束以及字符数据。
然而,面对嵌套结构复杂的 XML 文档,使用递归可以让数据处理变得更直观且结构清晰。本文将介绍如何结合递归与 xml_parse() 来解析嵌套的 XML 数据。
<catalog>
<book id="1">
<title>PHP Basics</title>
<author>John Doe</author>
</book>
<book id="2">
<title>Advanced PHP</title>
<author>Jane Smith</author>
</book>
</catalog>
我们首先需要创建一个解析器,并设置三种回调函数:
startElement():当解析器遇到一个开始标签时调用;
endElement():当解析器遇到一个结束标签时调用;
characterData():当解析器遇到标签中的文本时调用。
下面是完整代码示例:
<?php
$xml = <<<XML
<catalog>
<book id="1">
<title>PHP Basics</title>
<author>John Doe</author>
</book>
<book id="2">
<title>Advanced PHP</title>
<author>Jane Smith</author>
</book>
</catalog>
XML;
$parser = xml_parser_create();
$dataStack = [];
$currentData = null;
// 开始标签
function startElement($parser, $name, $attrs) {
global $dataStack, $currentData;
$element = [
'tag' => $name,
'attributes' => $attrs,
'children' => [],
'value' => ''
];
if ($currentData !== null) {
array_push($dataStack, $currentData);
}
$currentData = $element;
}
// 结束标签
function endElement($parser, $name) {
global $dataStack, $currentData;
if (!empty($dataStack)) {
$parent = array_pop($dataStack);
$parent['children'][] = $currentData;
$currentData = $parent;
}
}
// 文本内容
function characterData($parser, $data) {
global $currentData;
if (isset($currentData['value'])) {
$currentData['value'] .= trim($data);
}
}
xml_set_element_handler($parser, "startElement", "endElement");
xml_set_character_data_handler($parser, "characterData");
if (!xml_parse($parser, $xml, true)) {
die(sprintf("XML 错误: %s 在第 %d 行",
xml_error_string(xml_get_error_code($parser)),
xml_get_current_line_number($parser)));
}
xml_parser_free($parser);
// 打印最终结构
print_r($currentData);
?>
解析后,你将得到一个嵌套的数组结构,类似以下内容:
Array
(
[tag] => CATALOG
[attributes] => Array()
[children] => Array
(
[0] => Array
(
[tag] => BOOK
[attributes] => Array ( [ID] => 1 )
[children] => Array
(
[0] => Array ( [tag] => TITLE [value] => PHP Basics )
[1] => Array ( [tag] => AUTHOR [value] => John Doe )
)
)
[1] => Array
(
[tag] => BOOK
[attributes] => Array ( [ID] => 2 )
[children] => Array
(
[0] => Array ( [tag] => TITLE [value] => Advanced PHP )
[1] => Array ( [tag] => AUTHOR [value] => Jane Smith )
)
)
)
)
你可以轻松地将上面的数组结构转换为 JSON,以供前端调用或接口输出:
echo json_encode($currentData, JSON_PRETTY_PRINT);
如果 XML 文档来源于网络,比如 https://m66.net/data/books.xml,你可以使用 file_get_contents() 获取: