$ch = curl_init(); // InitialisierungcURL
$url = "http://example.com"; // Ziel -URL
curl_setopt($ch, CURLOPT_URL, $url); // Gesetzt angefordertURL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // Inhalt anstelle von direkter Ausgabe zurückgeben
$response = curl_exec($ch); // Eine Anfrage ausführen
curl_close($ch); // Schließen Sie die Sitzung
echo $response; // Webseiteninhalt ausgeben
Dieser Code vervollständigt den grundlegenden Prozess der Pulling -Seite HTML von einem Remote -Server.
$response = "<title>Example Title</title>"; // AnnahmeHTMLInhalt
$pattern = '/<title>(.*?)<\/title>/'; // übereinstimmen<title>Inhalt
preg_match($pattern, $response, $matches); // 执行übereinstimmen
$title = $matches[1]; // Holen Sie sich den Titel
echo $title; // Ausgabe:Example Title
Diese Methode eignet sich für Szenarien mit einfacheren Strukturen oder höheren Leistungsanforderungen.
$response = "<html><body>
<a href='http://example.com'>Link 1</a>
<a href='http://example.org'>Link 2</a>
</body></html>"; // WebseiteHTMLInhalt
$dom = new DOMDocument();
libxml_use_internal_errors(true); // verhindernHTMLAnalysefehler
$dom->loadHTML($response); // ladenHTMLInhalt
$links = $dom->getElementsByTagName('a'); // Holen Sie sich allesaEtikett
foreach ($links as $link) {
echo $link->getAttribute('href') . "<br>"; // Ausgabe链接地址
}
Im Vergleich zur regelmäßigen Übereinstimmung weist Domdocument eine stärkere Fehlertoleranz für unregelmäßige HTML auf und wird für die Verwendung auf komplexstrukturierten Seiten empfohlen.
Nachrichtenaggregation und Medienüberwachung
Produktpreisvergleich und E-Commerce-Analyse
Echtzeitwetter- und Verkehrsinformationsaufnahme
Finanzmarkt- und Aktiendatenerfassung
Durch die flexible Kombination von Netzwerkanforderungen und HTML -Parsing -Technologien können PHP -Entwickler verschiedene automatisierte Datenextraktionstools erstellen.