현재 위치: > 최신 기사 목록> PHP 정규 표현 자습서 : 효율적인 구문 분석 및 주요 텍스트 정보 추출

PHP 정규 표현 자습서 : 효율적인 구문 분석 및 주요 텍스트 정보 추출

M66 2025-08-02

PHP 정규식 소개

정규 표현식은 문자열을 일치시키고 처리하기위한 강력한 도구입니다. 특정 문자 패턴을 정의함으로써 일반 표현식은 문자열 형식을 확인하고 필요한 정보를 추출 할 수 있으며 데이터 검증 및 텍스트 처리 필드에서 널리 사용됩니다.

PHP에서 일반적으로 사용되는 정규식 기능에는 preg_match (), preg_match_all () 및 preg_replace ()가 포함됩니다. 이러한 기능은 개발자에게 편리한 텍스트 작동 방법을 제공합니다. 다음 예는 PHP 정규식을 사용하여 텍스트에서 주요 정보를 구문 분석하고 추출하는 방법을 보여줍니다.

예 1 : 이메일 주소 추출

텍스트에 여러 이메일 주소가 포함되어 있다고 가정하면 모든 사서함을 추출하여 배열에 저장하려고합니다.

<?php
// 소스 텍스트
$text = "내 이메일 주소입니다:abc@example.com,또 다른 이메일 주소입니다:def@example.com";

// 이메일 주소를 일치시키고 추출합니다
$pattern = '/[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}/';
preg_match_all($pattern, $text, $matches);

// 추출 된 이메일 주소를 출력하십시오
foreach ($matches[0] as $email) {
    echo "이메일 주소:" . $email . PHP_EOL;
}
?>

위의 코드에서 정규 표현 패턴은 이메일 주소를 공통 형식으로 일치시키는 데 사용됩니다. preg_match_all () 함수를 통해 모든 일치하는 결과는 더 쉬운 후속 처리를 위해 배열에 저장됩니다.

예제 2 : 구문 분석 URL 링크

정규 표현식을 사용하여 URL과 일치하고 호스트 이름 및 경로 정보를 추출하십시오.

<?php
// 소스 텍스트
$text = "당사 웹 사이트를 방문하십시오:http://www.example.com/path/to/page.html";

// 일치 및 추출URL링크
$pattern = '/https?:\/\/[^\s]+/';
preg_match($pattern, $text, $matches);

// 분석URL정보
$url = parse_url($matches[0]);
$host = $url['host'];
$path = $url['path'];

// 输出분석的URL정보
echo "호스트 이름:" . $host . PHP_EOL;
echo "길:" . $path . PHP_EOL;
?>

이 코드는 먼저 정규식을 통해 HTTP 또는 HTTPS로 시작하는 전체 URL과 일치 한 다음 PHP의 내장 Parse_url () 함수를 사용하여 링크를 구문 분석하여 호스트 이름 및 경로와 같은 특정 정보의 추출을 용이하게합니다.

요약

이 기사에서는 전자 메일 및 URL의 전형적인 응용 프로그램을 다루는 효율적인 구문 분석 및 정보 추출을 위해 PHP 정규식을 사용하는 방법을 보여줍니다. 실용적인 코드 예제를 사용하여 개발자가 PHP 정규식의 힘을 깊이 이해하고 텍스트 처리 작업을 강력하게 지원할 수 있도록 도와줍니다.