現在の位置: ホーム> 最新記事一覧> 複雑なパターンでさまざまなタイプのマークアップ言語を区別します

複雑なパターンでさまざまなタイプのマークアップ言語を区別します

M66 2025-06-03

PHPでは、特にテキストの交換とパターンマッチングが必要な場合、正規表現は強力なテキスト処理機能を提供します。 preg_replace_callback_arrayは、特にさまざまな種類のマークアップ言語(HTML、マークダウンなど)に細粒の操作が必要な場合に、複雑な交換操作を処理するために使用できる非常に便利な機能です。この記事では、 preg_replace_callback_array関数を使用して、これらのマークアップ言語を区別して処理する方法について説明します。

1。preg_replace_callback_array紹介

preg_replace_callback_arrayは、一連のコールバック関数を提供することにより、一連の通常の交換操作を実行できるPHPの関数です。通常のpreg_replaceとは異なり、一致するパターンごとに異なるコールバック関数を呼び出すことができ、処理ロジックをより柔軟にします。基本的な構文は次のとおりです。

 preg_replace_callback_array(array $patterns_and_callbacks, string $subject);
  • $ patterns_and_callbacks :連想配列、配列のキーは正規表現パターンであり、値は対応するコールバック関数です。

  • $件名:処理されるテキスト。

このアプローチは、同じテキストのさまざまな種類のマークアップ言語の処理など、複雑な交換要件に特に適しています。

2。さまざまな種類のマークアップ言語を処理します

多くのWebアプリケーションでは、多くの場合、多くの異なる形式でマークアップ言語を解析および処理する必要があります。たとえば、HTMLとMarkdownは同じページに共存するか、異なるマークアップ言語を統合形式に変換する必要があります。 preg_replace_callback_arrayを使用すると、各マークアップ言語の個別のアプローチを簡単に定義できます。

例:HTMLとMarkdownのリンクを交換します

HTML形式とMarkdown形式のリンクを含むテキストがあるとします。これを統合された形式で置き換えたいと考えています。この場合、 preg_replace_callback_arrayを使用して、これら2つの異なる形式のリンクを処理できます。

ステップ:

  1. 正規表現の定義:HTMLリンクとマークダウンリンクの正規表現をそれぞれ定義する必要があります。

  2. 定義コールバック関数:正規表現と一致する各リンク形式のコールバック関数を定義して、交換を実装します。

  3. preg_replace_callback_arrayに電話:処理のためにpreg_replace_callback_arrayに正規表現とコールバック関数を渡します。

サンプルコード:

 <?php

// テキストを入力します,含むHTMLそしてMarkdownフォーマットリンク
$text = "これはですHTMLリンク:<a href='http://m66.net/example'>ここをクリック</a>\nこれはですMarkdownリンク:[ここをクリック](http://m66.net/example)";

// 定义正则表达式そして回调函数
$patterns_and_callbacks = [
    // マッチHTMLリンク
    '/<a\s+href=["\'](http[s]?:\/\/m66\.net\/[^\s"\']+)["\'][^>]*>(.*?)<\/a>/' => function ($matches) {
        return "HTMLリンク:{$matches[2]},URL:{$matches[1]}";
    },
    // マッチMarkdownリンク
    '/\[(.*?)\]\(http[s]?:\/\/m66\.net\/([^\)]+)\)/' => function ($matches) {
        return "Markdownリンク:{$matches[1]},URL:http://m66.net/{$matches[2]}";
    }
];

// 使用preg_replace_callback_array交換します
$result = preg_replace_callback_array($patterns_and_callbacks, $text);

// 処理後に結果を出力します
echo $result;

説明する:

  • 最初の正規表現は、HTMLの<a>タグを一致させ、URLとリンクテキストをキャプチャするために使用されます。

  • 2番目の正規表現は、リンク形式でリンクを一致させるために使用され、リンクテキストとURLをキャプチャします。

  • 一致ごとに、コールバック関数はカスタム形式を返し、リンクのテキストとURLを出力します。

出力結果:

 これはですHTMLリンク:HTMLリンク:ここをクリック,URL:http://m66.net/example
これはですMarkdownリンク:Markdownリンク:ここをクリック,URL:http://m66.net/example

3. preg_replace_callback_arrayを使用する利点

preg_replace_callback_arrayは、いくつかの重要な利点を提供します。

  • 柔軟性:各正規表現パターンの異なるコールバック関数を定義でき、処理ロジックは非常に複雑になる可能性があります。

  • 保守性:異なる処理ルールを異なるマークアップ言語に適用する必要がある場合、コードはより明確かつ維持しやすく編成されます。

  • 効率:複数の交換操作を組み合わせることで、1つのテキスト処理ですべての交換を完了し、それにより効率を向上させることができます。

4.複数のマークアップ言語の複雑な状況を処理します

複数のマークアップ言語を扱う際に、より複雑な状況があるかもしれません。たとえば、HTMLとマークダウンはネストされたもので使用される場合があります。または、同じテキストに複数の形式のタグが含まれています。 preg_replace_callback_arrayでは、試合の特定のコンテンツに基づいて、さまざまな交換戦略を柔軟に適用できます。

例:HTMLとMarkdownでの両方のネストされたタグを処理します

<?php

$text = "これはですHTMLリンク:<a href='http://m66.net/example'>ここをクリック</a>\nこれはですMarkdownリンク:[ここをクリック](http://m66.net/example)";

// 定义正则表达式そして回调函数
$patterns_and_callbacks = [
    '/<a\s+href=["\'](http[s]?:\/\/m66\.net\/[^\s"\']+)["\'][^>]*>(.*?)<\/a>/' => function ($matches) {
        return "HTMLリンク:{$matches[2]},URL:{$matches[1]}";
    },
    '/\[(.*?)\]\(http[s]?:\/\/m66\.net\/([^\)]+)\)/' => function ($matches) {
        return "Markdownリンク:{$matches[1]},URL:http://m66.net/{$matches[2]}";
    }
];

// 使用preg_replace_callback_array交換します
$result = preg_replace_callback_array($patterns_and_callbacks, $text);

// 処理後に結果を出力します
echo $result;

このコードは、HTMLおよびMarkdown形式にリンクし、それらを1つの形式に統合して、後続の処理を簡単にします。

5。概要

preg_replace_callback_arrayは、複雑な通常の交換タスクの処理に特に適した強力なツールです。 1つのテキストで複数のマークアップ言語を処理する必要がある場合に、柔軟で効率的なソリューションを提供します。正規表現とコールバック関数を合理的に設計することにより、さまざまな種類のマークアップ言語を簡単に区別して処理できます。