텍스트 분류 및 자연어 처리에 PHP를 사용하는 방법에 대한 실용 가이드

M66 2025-06-03

텍스트 분류 및 자연어 처리에 PHP를 사용하는 방법

데이터가 증가함에 따라 많은 양의 텍스트 데이터를 효과적으로 처리하는 방법은 오늘날 데이터 분석 및 의사 결정 지원에서 중요한 주제가되었습니다. 텍스트 분류 및 자연어 처리 (NLP) 기술은 점점 더 널리 사용되고 있으며 소셜 미디어 분석, 감정 분석 및 권장 시스템과 같은 많은 분야에서 중요한 역할을합니다. 이 기사는 텍스트 분류 및 자연어 처리에 PHP를 사용하는 방법을 소개하여 개발자가 이러한 기술을 이해하고 적용 할 수 있도록 도와줍니다.

1. 텍스트 분류의 기본 원칙

텍스트 분류는 일반적으로 텍스트의 내용 또는 특성을 기반으로 특정 표준에 따라 텍스트 데이터를 정렬하는 프로세스입니다. 기본 단계에는 다음이 포함됩니다. 먼저 텍스트 데이터를 컴퓨터가 이해할 수있는 형식으로 변환 한 다음 머신 러닝 알고리즘을 사용하여 분류 모델을 훈련시키고 모델을 사용하여 새로운 데이터를 분류합니다.

2. PHP의 텍스트 분류 라이브러리

PHP에는 TextClassifier 및 PHP-ML을 포함하여 일반적으로 사용되는 몇 가지 텍스트 분류 라이브러리가 있습니다. 이 라이브러리는 기능 추출, 알고리즘 교육 및 모델 평가와 같은 강력한 텍스트 처리 기능을 제공 할 수 있습니다. 다음은 TextClassifier에서 텍스트를 분류하는 방법을 예로 들어 소개합니다.

TextClassifier를 설치하십시오

TextClassifier는 Composer를 통해 설치할 수있는 PHP를 기반으로 한 오픈 소스 텍스트 분류 라이브러리입니다. 프로젝트 루트 디렉토리에서 다음 내용이있는 composer.json 파일을 만듭니다.

{
  "필요하다": {
    "Miguelnibral/Text Classifier": "Dev-Master"
  }
}

다음으로 다음 명령을 실행하여 TextClassifier를 설치하십시오.

 작곡가 설치

분류 모델을 만듭니다

설치가 완료되면 다음 코드를 사용하여 분류 모델을 작성하고 교육 할 수 있습니다.

require_once &#39;공급 업체/autoload.php&#39;;

TextClassifier \ TextClassifier를 사용하십시오.

$ classifier = new TextClassifier ();

// 교육 데이터 추가 $ Classifier-> addExample ( &#39;이 영화를 좋아합니다&#39;, &#39;긍정적&#39;);
$ classifier-> addexample ( &#39;이 영화는 끔찍하다&#39;, &#39;부정&#39;);

// 훈련 모델 $ classifier-> train ();

// 모델 저장 $ classifier-> savemodel ( &#39;model.ser&#39;);

위의 예에서 먼저 TextClassifier 객체를 생성하고 두 개의 텍스트와 해당 태그 ( 'positive'및 'negative')를 추가합니다. 그런 다음 Train () 방법을 호출하여 모델을 교육하고 마지막으로 Savemodel ()을 사용하여 숙련 된 모델을 저장하십시오.

텍스트 분류에 분류 모델을 사용하십시오

훈련이 완료되고 모델이 저장되면 알 수없는 텍스트를 분류하는 데 사용할 수 있습니다. 코드 예는 다음과 같습니다.

require_once &#39;공급 업체/autoload.php&#39;;

TextClassifier \ TextClassifier를 사용하십시오.

$ classifier = new TextClassifier ();

// 저장된 모델을로드 $ classifier-> loadModel ( &#39;model.ser&#39;);

// 분류 해야하는 텍스트 $ 텍스트 = &#39;이 영화는 훌륭합니다&#39;;

// 카테고리 $ 카테고리 = $ classifier-> classify ($ text);

echo "텍스트 &#39;$ 텍스트&#39;의 범주는 &#39;$ category&#39;입니다.

위의 코드를 사용하면 저장된 모델을로드하고이를 사용하여 새 텍스트를 분류합니다.

3. 자연어 처리의 기본 원칙

NLP (Natural Language Processing)는 인간 언어를 컴퓨터 이해 및 처리 형식으로 변환하여 어휘 분석, 구문 분석 및 시맨틱 분석과 같은 다양한 언어 관련 작업을 수행하는 것을 목표로합니다. NLP 기술은 언어의 구조와 의미를 이해하고 기계 번역, 음성 인식 및 기타 분야에 적용하는 데 도움이됩니다.

4. PHP의 자연 언어 처리 라이브러리

PHP에서 일반적으로 사용되는 자연 언어 처리 라이브러리에는 대칭 및 오펜 칼라가 포함됩니다. Word Pociplele, Part-of-Steech Annotation, Keyword Extraction 등과 같은 기능을 제공 할 수 있습니다.

Symmetrica를 설치하십시오

Symmetrica는 PHP를 기반으로 한 오픈 소스 자연어 처리 라이브러리로 작곡가를 통해 설치할 수도 있습니다. 프로젝트 루트 디렉토리에서 다음 내용으로 composer.json 파일을 만듭니다.

{
  "필요하다": {
    "Kalmanolah/Symmetrica": "Dev-Master"
  }
}

그런 다음 다음 명령을 실행하여 Symmetrica를 설치하십시오.

 작곡가 설치

단어 세분화에는 대칭을 사용하십시오

다음은 Symmetrica를 사용한 단어 세분화에 대한 코드 예제입니다.

require_once &#39;공급 업체/autoload.php&#39;;

대칭 \ Tokenizer를 사용하십시오.

$ tokenizer = new Tokenizer ();
$ text = &#39;이것은 샘플 문장입니다.&#39;;

// Word partiple $ tokens = $ tokenizer-> tokenize ($ text);

// word inpightle result foreach ($ 토큰 AS $ 토큰) {
  에코 $ 토큰. php_eol;
}

위의 예에서는 먼저 Tokenizer 객체를 작성한 다음 Tokenize () 메소드를 사용하여 텍스트를 별도의 단어로 나누고 마지막 으로이 단어를 출력하기 위해 횡단합니다.

대칭을 사용한 키워드 추출

단어 분사 외에도 Symmetrica를 사용하여 텍스트에서 키워드를 추출 할 수 있습니다. 해당 코드 예는 다음과 같습니다.

require_once &#39;공급 업체/autoload.php&#39;;

Symmetrica \ keywordextractor를 사용하십시오.

$ extractor = 새로운 keywordextractor ();
$ text = &#39;이것은 샘플 문장입니다.&#39;;

// 키워드 추출 수행 $ Keywords = $ extractor-> Extract ($ text);

// Keyword foreach ($ 키워드 AS $ 키워드) {
  echo $ 키워드. php_eol;
}

위의 코드를 통해 Symmetrica의 KeywordExtractor 클래스를 사용하여 텍스트에서 키워드를 추출합니다.

결론

이 기사는 텍스트 분류 및 자연어 처리에 PHP를 사용하는 방법을 소개하고 관련 코드 예제를 제공합니다. 이러한 기술을 학습하고 연습함으로써 개발자는 실제 응용 프로그램에서 TextClassifier 및 Symmetrica와 같은 PHP 라이브러리를 유연하게 사용할 수 있으므로 데이터 분석 및 의사 결정에 대한 효과적인 지원을 제공 할 수 있습니다.