HTML 및 XML 문서를 처리하기 위해 PHP에서 DOM 파싱 사용에 대한 튜토리얼 전체

M66 2025-07-30

HTML 및 XML 문서를 처리하기 위해 PHP에서 DOM 파싱 사용에 대한 튜토리얼 전체

웹 개발에서 HTML 또는 XML 문서를 구문 분석 및 처리하는 것이 일반적인 요구 사항입니다. PHP는 DOM (Document Object Model) 기술을 제공하여 개발자가 이러한 문서를 효율적으로 운영하고 처리 할 수 있도록 도와줍니다. DOM은 트리 구조를 통해 문서를 나타내고 운영하는 플랫폼 독립 API입니다. 문서 노드 추가, 삭제, 수정 및 검색을 지원합니다.

이 튜토리얼에서는 간단한 PHP 예제를 사용하여 DOM을 사용하여 HTML/XML 문서를 구문 분석하고 처리하여 제목 및 링크와 같은 데이터를 추출하는 방법을 보여줍니다.

Dom Parsing 예제

간단한 태그와 내용이 포함 된 다음 HTML 문서가 있다고 가정합니다.

 <!DOCTYPE html>
<html>
  <head>
    <title>샘플 문서</title>
  </head>
  <body>
    <h1>환영DOM분석 예</h1>
    <ul>
      <li><a href="https://www.example.com">예제 링크1</a></li>
      <li><a href="https://www.example.com">예제 링크2</a></li>
      <li><a href="https://www.example.com">예제 링크3</a></li>
    </ul>
  </body>
</html>

우리의 목표는 PHP 스크립트를 통해이 HTML 문서를 구문 분석하여 제목과 모든 링크를 추출하는 것입니다.

PHP 코드 예제

다음은 PHP DOM 객체를 사용하여 위의 HTML 문서를 구문 분석하는 코드입니다.

 <?php
// aDOM물체
$dom = new DOMDocument();

// 짐HTML문서
$dom->loadHTMLFile('example.html');

// 모든 것을 얻으십시오h1상표
$headings = $dom->getElementsByTagName('h1');
foreach ($headings as $heading) {
    echo '제목: ' . $heading->nodeValue . '<br>';
}

// 모든 것을 얻으십시오a상표
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
    echo '링크: ' . $link->getAttribute('href') . '<br>';
}
?>

코드 출력 결과

위 코드를 실행할 때 출력 결과는 다음과 같습니다.

 제목: 환영DOM분석 예
링크: https://www.example.com
링크: https://www.example.com
링크: https://www.example.com

보시다시피, DOM 객체의 관련 방법을 사용하여 HTML 문서를 성공적으로 구문 분석하고 제목과 모든 링크를 추출했습니다.

결론적으로

PHP의 DOM Extension을 통해 HTML/XML 문서를 쉽게 구문 분석하고 처리 할 수 있으며 노드 트래버스, 쿼리, 속성 획득, 노드 삭제 및 삽입 작업을 수행 할 수 있습니다. DOM의 언어 독립성은 다양한 개발 환경에 적합합니다.

실제 개발에서 DOM은 XPath와 같은 다른 기술과 함께 사용하여보다 복잡한 HTML/XML 구조를 처리 할 수 있습니다. 이 튜토리얼이 PHP에서 DOM을 사용하여 문서를 구문 분석하고 프로젝트에서 유연하게 사용할 수있는 방법을 마스터하는 데 도움이되기를 바랍니다.

이 튜토리얼은 Dom Parsing의 기본 기능 만 보여줍니다. 실제 애플리케이션에는보다 복잡한 HTML/XML 문서 구조가 포함될 수 있으며 개발자는 특정 요구에 따라 확장 및 최적화 할 수 있습니다.

관련 태그:
HTML