開発プロセス中に、Webページのソースコードを取得する必要がある場合があります。 PHPは、この要件を達成するためのいくつかの方法を提供し、この記事では最も一般的に使用される3つの方法を紹介します。
file_get_contents()関数を使用して、WebページのHTMLソースコードを含むリモートWebページのコンテンツを読み取ることができます。この関数を使用する例は次のとおりです。
$source = file_get_contents($url);
その中で、$ URLはソースコードを取得するWebページアドレスであり、$ソースにはWebページのHTMLソースコードが含まれています。
Curlは、Webページソースコードの取得を含む、PHPでのデータ転送用の強力なライブラリです。 Curlを使用する場合、通常、次の手順を実行する必要があります。
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$source = curl_exec($ch);
curl_close($ch);
ここでは、$ chはcurlセッションハンドル、curl_setopt()はオプションを設定するために使用され、curl_exec()がセッションを実行してWebページソースコードを取得し、curl_close()を使用してcurlセッションを閉じるために使用されます。
DomDocumentは、HTMLおよびXMLドキュメントを簡単に解析および操作できるPHPの組み込みクラスです。このクラスを使用して、Webページのソースコードを取得できます。 DomDocumentを使用してWebページのソースコードを取得する例を次に示します。
$dom = new DOMDocument();
$dom->loadHTML($url);
$source = $dom->saveHTML();
ここで、$ domはdomdocumentオブジェクトであり、loadhtml()メソッドはWebページソースコードを読み込み、savehtml()メソッドはロードされたHTMLコンテンツを返します。
上記の3つの方法はすべて、Webページソースコードを効果的に取得できます。さまざまなニーズに応じて実装するための適切な方法を選択できます。単にWebコンテンツを取得する必要がある場合、file_get_contents()が最も簡単で簡単な選択です。より柔軟なコントロールが必要な場合、カールがより良い選択です。また、HTMLソースコードを解析および操作する必要がある場合、Domdocumentクラスが理想的なツールです。