Position actuelle: Accueil> Derniers articles> Compléter le tutoriel sur l'utilisation de l'analyse DOM en PHP pour traiter les documents HTML et XML

Compléter le tutoriel sur l'utilisation de l'analyse DOM en PHP pour traiter les documents HTML et XML

M66 2025-07-30

Compléter le tutoriel sur l'utilisation de l'analyse DOM en PHP pour traiter les documents HTML et XML

Dans le développement Web, l'analyse et le traitement des documents HTML ou XML sont une exigence commune. PHP fournit une technologie DOM (Document Object Model) pour aider les développeurs à opérer et à traiter ces documents efficacement. DOM est une API indépendante de la plate-forme qui représente et exploite des documents via une structure d'arbre. Il prend en charge l'ajout, supprimer, modifier et rechercher des nœuds de documents.

Dans ce didacticiel, nous utiliserons un exemple PHP simple pour montrer comment analyser et traiter les documents HTML / XML à l'aide de DOM, extraire des données telles que les titres et les liens.

Exemple d'analyse DOM

Supposons que nous ayons le document HTML suivant contenant des balises et du contenu simples:

 <!DOCTYPE html>
<html>
  <head>
    <title>Exemple de documentation</title>
  </head>
  <body>
    <h1>AccueillirDOMExemple d&#39;analyse</h1>
    <ul>
      <li><a href="https://www.example.com">Exemple de lien1</a></li>
      <li><a href="https://www.example.com">Exemple de lien2</a></li>
      <li><a href="https://www.example.com">Exemple de lien3</a></li>
    </ul>
  </body>
</html>

Notre objectif est d'analyser ce document HTML via un script PHP, d'extraire le titre et tous les liens là-bas.

Exemple de code PHP

Voici le code pour utiliser un objet PHP Dom pour analyser le document HTML ci-dessus:

 <?php
// Créer unDOMObjet
$dom = new DOMDocument();

// chargerHTMLdocument
$dom->loadHTMLFile('example.html');

// Faire touth1Étiquette
$headings = $dom->getElementsByTagName('h1');
foreach ($headings as $heading) {
    echo 'titre: ' . $heading->nodeValue . '<br>';
}

// Faire toutaÉtiquette
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
    echo 'Lien: ' . $link->getAttribute('href') . '<br>';
}
?>

Résultat de sortie du code

Lors de l'exécution du code ci-dessus, le résultat de sortie est le suivant:

 titre: AccueillirDOMExemple d&#39;analyse
Lien: https://www.example.com
Lien: https://www.example.com
Lien: https://www.example.com

Comme vous pouvez le voir, en utilisant des méthodes pertinentes des objets DOM, nous avons analysé avec succès le document HTML et extrait le titre et tous les liens là-bas.

en conclusion

Grâce à l'extension DOM de PHP, nous pouvons facilement analyser et traiter les documents HTML / XML, effectuer des nœuds, la requête, la requête, l'acquisition d'attribut, la suppression de nœuds et les opérations d'insertion. L'indépendance linguistique de Dom le rend adapté à une variété d'environnements de développement.

Dans le développement réel, DOM peut être utilisé en conjonction avec d'autres technologies telles que XPATH pour gérer des structures HTML / XML plus complexes. J'espère que ce tutoriel peut vous aider à maîtriser la méthode d'utilisation de DOM pour analyser les documents en PHP et peut être utilisé de manière flexible dans votre projet.

Ce tutoriel ne montre que les fonctions de base de l'analyse DOM. Les applications pratiques peuvent impliquer des structures de documents HTML / XML plus complexes, et les développeurs peuvent se développer et optimiser en fonction des besoins spécifiques.

  • Étiquettes associées:

    HTML