現在の位置: ホーム> 最新記事一覧> PHP正規表現チュートリアル:キーテキスト情報の効率的な解析と抽出

PHP正規表現チュートリアル:キーテキスト情報の効率的な解析と抽出

M66 2025-08-02

PHP正規表現の紹介

正規表現は、文字列を一致および処理するための強力なツールです。特定の文字パターンを定義することにより、正規表現は文字列形式を確認し、必要な情報を抽出し、データ検証とテキスト処理の分野で広く使用されます。

PHPでは、一般的に使用される正規表現関数には、preg_match()、preg_match_all()、preg_replace()が含まれます。これらの機能は、開発者に便利なテキスト操作方法を提供します。次の例は、PHP正規表現を使用してテキストから重要な情報を解析および抽出する方法を示しています。

例1:メールアドレスを抽出します

テキストに複数の電子メールアドレスが含まれていると仮定すると、すべてのメールボックスを抽出し、配列に保存します。

<?php
// ソーステキスト
$text = "私のメールアドレスはです:abc@example.com,別のメールアドレスは次のとおりです:def@example.com";

// メールアドレスを一致させて抽出します
$pattern = '/[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}/';
preg_match_all($pattern, $text, $matches);

// 抽出されたメールアドレスを出力します
foreach ($matches[0] as $email) {
    echo "電子メールアドレス:" . $email . PHP_EOL;
}
?>

上記のコードでは、正規表現パターンを使用して、一般的な形式でメールアドレスを一致させます。 preg_match_all()関数を介して、すべての一致する結果は、後続の処理を容易にするために配列に保存されます。

例2:URLリンクの解析

正規表現を使用して、URLとホスト名とパス情報を抽出します。

<?php
// ソーステキスト
$text = "当社のウェブサイトをご覧ください:http://www.example.com/path/to/page.html";

// 一致して抽出しますURLリンク
$pattern = '/https?:\/\/[^\s]+/';
preg_match($pattern, $text, $matches);

// 分析URL情報
$url = parse_url($matches[0]);
$host = $url['host'];
$path = $url['path'];

// 输出分析的URL情報
echo "ホスト名:" . $host . PHP_EOL;
echo "パス:" . $path . PHP_EOL;
?>

このコードは、正規表現を介してHTTPまたはHTTPSで始まる完全なURLと一致し、次にPHPの組み込みParse_url()関数を使用してリンクを解析して、ホスト名やパスなどの特定の情報の抽出を容易にします。

要約します

この記事では、電子メールとURLの典型的なアプリケーションをカバーするために、効率的な解析とテキストの情報抽出にPHP正規表現を使用する方法を示しています。実用的なコードの例を使用して、開発者がPHPの正規表現の力を詳細に理解し、テキスト処理タスクを強力にサポートします。