현재 위치: > 최신 기사 목록> HTML 및 XML을 구문 분석하는 PHP의 실용 가이드

HTML 및 XML을 구문 분석하는 PHP의 실용 가이드

M66 2025-07-01

PHP에서 HTML 및 XML을 구문 분석하는 실용적인 방법

웹 개발에서 HTML 및 XML은 공통 데이터 형식이며 페이지 컨텐츠 디스플레이 및 데이터 상호 작용에 널리 사용됩니다. PHP는 HTML 페이지를 생성 할뿐만 아니라 HTML/XML 구조를 직접 구문 분석하고 조작하여 개발 효율성과 유연성을 크게 향상시킬 수 있습니다. 이 기사에서는 PHP의 domdocument 클래스를 사용하여 HTML/XML 파일을 구문 분석, 읽기 및 처리하는 방법을 소개합니다.

php를 사용한 HTML 컨텐츠를 구문 분석합니다

HTML 파일에는 일반적으로 태그, 속성 및 텍스트와 같은 구조화 된 컨텐츠가 포함되어 있습니다. PHP에서는 domdocument 클래스를 사용하여 HTML을로드하고 구문 분석 할 수 있습니다. 다음 예는 기본 사용법을 보여줍니다.

<?php
$html = '<html><body><h1>Title</h1><p>Content</p></body></html>';

$dom = new DOMDocument();
$dom-> loadhtml ($ html);

echo $ dom-> savehtml ();
?>

이 코드는 HTML 문자열을 DOM에로드하고 HTML 형식으로 출력합니다. 태그 구조는 필요에 따라 추가로 액세스하고 작동 할 수 있습니다.

XML 컨텐츠를 구문 분석하는 방법

XML은 데이터 전송 및 스토리지에 널리 사용되는 마크 업 언어입니다. DomDocument는 XML 로딩 및 구문 분석도 지원합니다.

<?php
$xml = '<root><element1>Value 1</element1><element2>Value 2</element2></root>';

$dom = new DOMDocument();
$dom-> loadxml ($ xml);

echo $ dom-> savexml ();
?>

위의 코드는 XML 구조를 DOM 객체에로드하고 표준 XML 형식으로 출력하여 데이터 인터페이스 또는 데이터 변환과 같은 시나리오에서 사용할 수 있습니다.

HTML/XML에서 내용을 추출하십시오

domDocument를 사용하면 제목 및 단락 내용과 같은 특정 태그에 대한 컨텐츠를 쉽게 얻을 수 있습니다.

<?php
$html = '<html><body><h1>Title</h1><p>Content</p></body></html>';

$dom = new DOMDocument();
$dom-> loadhtml ($ html);

$ title = $ dom-> getElementsByTagName ( &#39;h1&#39;)-> item (0)-> nodevalue;
$ content = $ dom-> getElementsByTagName ( &#39;p&#39;)-> item (0)-> nodevalue;

echo "제목 :". $ 제목. "<br> ";
Echo "Content :". $ 컨텐츠. "<br> ";
?>

이 코드는 태그 이름을 통해 DOM의 요소에 액세스하고 텍스트 컨텐츠를 추출하여 컨텐츠 수집 및 자동 분석에 매우 적합합니다.

HTML 구조에서 컨텐츠를 수정하십시오

읽기 외에도 HTML에서 태그 내용을 동적으로 수정할 수도 있습니다. 예를 들어 제목 텍스트를 수정하십시오.

<?php
$html = '<html><body><h1>Title</h1><p>Content</p></body></html>';

$dom = new DOMDocument();
$dom-> loadhtml ($ html);

$ title = $ dom-> getElementsByTagName ( &#39;h1&#39;)-> item (0);
$ title-> nodevalue = &#39;새 제목&#39;;

echo $ dom-> savehtml ();
?>

실행 후 출력 HTML의 원래 제목 컨텐츠는 "새 제목"으로 대체됩니다. 이 방법은 동적 페이지 구조를 생성하거나 조정하는 데 적합합니다.

HTML 구조에 요소를 추가하십시오

새 요소를 추가 해야하는 경우 DomDocument 메소드를 사용하여 동적으로 생성하고 삽입 할 수도 있습니다. 예를 들어 페이지에 자막을 추가하십시오.

<?php
$html = '<html><body><h1>Title</h1><p>Content</p></body></html>';

$dom = new DOMDocument();
$dom-> loadhtml ($ html);

$ newElement = $ dom-> createElement ( &#39;h2&#39;, &#39;subtitle&#39;);
$ dom-> getElementsByTagName ( &#39;body&#39;)-> item (0)-> AppendChild ($ newlement);

echo $ dom-> savehtml ();
?>

이 코드는 원래 HTML 구조에 있습니다 새로운 것을 부분적으로 추가하십시오

태그 내용.

요약

PHP의 DomDocument 클래스를 통해 개발자는 HTML 및 XML 파일 컨텐츠를 유연하게 구문 분석, 읽기, 수정 및 확장하여보다 복잡한 컨텐츠 작업 및 데이터 처리 시나리오를 지원할 수 있습니다. 크롤러 개발, 템플릿 엔진 또는 데이터 구조 변환이든 DomDocument는 매우 실용적인 도구입니다.