개발 과정에서 때로는 웹 페이지의 소스 코드를 얻어야합니다. PHP는이 요구 사항을 달성하는 몇 가지 방법을 제공 하며이 기사는 가장 일반적으로 사용되는 세 가지 방법을 소개합니다.
file_get_contents () 함수는 웹 페이지의 HTML 소스 코드를 포함하여 원격 웹 페이지의 내용을 읽는 데 사용될 수 있습니다. 다음은이 기능을 사용하는 예입니다.
$source = file_get_contents($url);
그중에는 $ URL이 소스 코드를 가져올 웹 페이지 주소이며 $ source에는 웹 페이지의 HTML 소스 코드가 포함됩니다.
Curl은 웹 페이지 소스 코드를 포함하여 PHP의 데이터 전송을위한 강력한 라이브러리입니다. 컬을 사용할 때는 일반적으로 다음 단계를 수행해야합니다.
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$source = curl_exec($ch);
curl_close($ch);
여기에서 $ ch는 CURL 세션 핸들이며, curl_setopt ()는 옵션을 설정하는 데 사용되며 Curl_Exec ()는 세션을 실행하고 웹 페이지 소스 코드를 가져 오며 Curl_Close ()는 CURL 세션을 닫는 데 사용됩니다.
DomDocument는 HTML 및 XML 문서를 쉽게 구문 분석하고 조작 할 수있는 PHP의 내장 클래스입니다. 이 클래스를 사용하여 웹 페이지의 소스 코드를 얻을 수 있습니다. 다음은 DomDocument를 사용하여 웹 페이지의 소스 코드를 얻는 예입니다.
$dom = new DOMDocument();
$dom->loadHTML($url);
$source = $dom->saveHTML();
여기서 $ dom은 domdocument 객체이며 LoadHtml () 메소드는 웹 페이지 소스 코드를로드하고 SaveHTML () 메소드는로드 된 HTML 컨텐츠를 반환합니다.
위의 세 가지 메소드는 모두 웹 페이지 소스 코드를 효과적으로 얻을 수 있습니다. 다른 요구에 따라이를 구현할 올바른 방법을 선택할 수 있습니다. 단순히 웹 컨텐츠를 얻기 만하면 File_get_Contents ()가 가장 쉽고 간단한 선택입니다. 보다 유연한 제어가 필요한 경우 컬이 더 나은 선택입니다. 또한 HTML 소스 코드를 구문 분석하고 조작 해야하는 경우 DomDocument 클래스가 이상적인 도구입니다.