HTML DOM (문서 개체 모델)은 HTML 문서를 구문 분석하고 조작하기위한 API입니다. 이를 통해 개발자는 HTML 문서의 구조, 내용 및 속성에 프로그래밍 적으로 액세스 할 수 있습니다. PHP에는 일반적으로 사용되는 라이브러리가 있으며 HTML DOM을 쉽게 구문 분석하고 생성 할 수 있습니다. 이 기사에서는 관련 코드 예제와 함께 PHP Simple HTML Dom Parser 및 PHPQuery의 두 가지 인기 라이브러리에 중점을 둘 것입니다.
PHP Simple HTML Dom Parser는 HTML 문서를 구문 분석 할 수있는 강력한 도구입니다. jQuery와 유사한 선택기 구문을 사용하여 구문 분석 HTML 문서를보다 직관적으로 만듭니다. 다음은 PHP Simple HTML Dom Parser를 사용하여 HTML 문서를 구문 분석하는 예입니다.
<?php include('simple_html_dom.php'); // 새로운 것을 만듭니다HTML DOM물체 $html = new simple_html_dom(); // ~에서URL짐HTML $html-> load_file ( 'http://example.com/page.html'); // selector 구문을 사용하여 요소를 가져옵니다. $ element = $ html-> find ( '. class-name', 0); // 요소의 텍스트 내용을 가져옵니다. $ text = $ element-> innerText; // 출력 결과 Echo $ 텍스트; // html dom 객체를 릴리스 $ html-> clear (); ?>
위의 코드에는 먼저 simple_html_dom.php 파일이 포함 된 다음 새 HTML dom 객체를 작성하고`load_file ()`메소드를 사용하여 지정된 URL에서 html 문서를로드합니다. 다음으로`find ( '. class-name', 0)`를 통해 클래스`class-name`을 사용하여 첫 번째 요소를 가져오고 마지막으로`innertext` 속성을 통해 요소의 텍스트 내용을 가져 와서 출력하십시오.
PHPQuery는 HTML 문서를 구문 분석하고 조작하기위한 jQuery와 같은 API를 제공하는 또 다른 강력한 HTML 구문 분석 라이브러리입니다. 다음은 phpquery를 사용하여 HTML 문서를 구문 분석하는 예입니다.
<?php require('phpQuery.php'); // 새로운 것을 만듭니다PHPQuery물체 $document = phpQuery::newDocumentFileHTML('http://example.com/page.html'); // 선택기 구문을 사용하여 요소를 가져옵니다 $element = $document-> 찾기 ( '. class-name')-> eq (0); // 요소의 텍스트 내용을 가져옵니다. $ text = $ element-> text (); // 출력 결과 Echo $ 텍스트; // phpQuery 객체 vere verpquery :: unloaddocuments (); ?>
이 코드에는 먼저 phpquery.php 파일을 포함시킨 다음`newDocumentFileHtml () 메소드를 통해 지정된 URL에서 HTML 문서를로드합니다. 그 후, 첫 번째`class-name '요소는`find ('. class-name ')-> eq (0)`에 의해 얻은 다음`text ()`메소드를 사용하여 텍스트 내용을 얻고 출력합니다.
PHP Simple HTML Dom Parser 또는 PHPQuery를 사용하든 HTML Dom을 쉽게 구문 분석하고 생성 할 수 있습니다. 이 라이브러리는 풍부한 API를 제공하여 HTML 문서의 작동을보다 간단하고 유연하게 만듭니다. Selector Syntax를 사용하면 HTML 요소를 쉽게 얻고 조작 할 수 있습니다. 이 기사의 샘플 코드가 PHP에서 구문 분석 및 HTML DOM을 구현하는 방법을 더 잘 이해하는 데 도움이되기를 바랍니다.