PHPでDom Parsingを使用してHTMLおよびXMLドキュメントを処理するための完全なチュートリアル

M66 2025-07-30

PHPでDom Parsingを使用してHTMLおよびXMLドキュメントを処理するための完全なチュートリアル

Web開発では、HTMLまたはXMLドキュメントの解析と処理が一般的な要件です。 PHPは、開発者がこれらのドキュメントを効率的に運用および処理するのに役立つDOM（Document Object Model）テクノロジーを提供します。 DOMは、ツリー構造を介してドキュメントを表現および操作するプラットフォームに依存しないAPIです。ドキュメントノードの追加、削除、変更、および検索をサポートします。

このチュートリアルでは、Simple PHPの例を使用して、DOMを使用してHTML/XMLドキュメントを解析および処理し、タイトルやリンクなどのデータを抽出する方法を示します。

Dom Parsingの例

いくつかの簡単なタグとコンテンツを含む次のHTMLドキュメントがあるとします。

 <!DOCTYPE html>
<html>
  <head>
    <title>サンプルドキュメント</title>
  </head>
  <body>
    <h1>いらっしゃいませDOM分析の例</h1>
    <ul>
      <li><a href="https://www.example.com">リンクの例1</a></li>
      <li><a href="https://www.example.com">リンクの例2</a></li>
      <li><a href="https://www.example.com">リンクの例3</a></li>
    </ul>
  </body>
</html>

私たちの目標は、PHPスクリプトを介してこのHTMLドキュメントを解析し、タイトルとそこにすべてのリンクを抽出することです。

PHPコードの例

PHP DOMオブジェクトを使用して上記のHTMLドキュメントを解析するコードは次のとおりです。

 <?php
// aを作成しますDOM物体
$dom = new DOMDocument();

// 負荷HTML書類
$dom->loadHTMLFile('example.html');

// すべてを取得しますh1ラベル
$headings = $dom->getElementsByTagName('h1');
foreach ($headings as $heading) {
    echo 'タイトル: ' . $heading->nodeValue . '<br>';
}

// すべてを取得しますaラベル
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
    echo 'リンク: ' . $link->getAttribute('href') . '<br>';
}
?>

コード出力の結果

上記のコードを実行するとき、出力の結果は次のとおりです。

 タイトル: いらっしゃいませDOM分析の例
リンク: https://www.example.com
リンク: https://www.example.com
リンク: https://www.example.com

ご覧のとおり、DOMオブジェクトの関連する方法を使用することにより、HTMLドキュメントを正常に解析し、タイトルとすべてのリンクを抽出しました。

結論は

PHPのDOM拡張機能を介して、HTML/XMLドキュメントを簡単に解析および処理し、ノードトラバーサル、クエリ、属性取得、ノード削除、挿入操作を実行できます。 DOMの言語独立性により、さまざまな開発環境に適しています。

実際の開発では、DOMは、より複雑なHTML/XML構造を処理するために、XPathなどの他のテクノロジーと組み合わせて使用できます。このチュートリアルが、DOMを使用してPHPでドキュメントを解析する方法を習得し、プロジェクトで柔軟に使用できることを願っています。

このチュートリアルは、Dom Parsingの基本的な機能のみを示しています。実用的なアプリケーションには、より複雑なHTML/XMLドキュメント構造が含まれる場合があり、開発者は特定のニーズに応じて拡張および最適化できます。

関連タグ:
HTML