현재 위치: > 최신 기사 목록> 통계 결과를 사용하여 Word Cloud 그래프 데이터를 생성하는 방법은 무엇입니까?

통계 결과를 사용하여 Word Cloud 그래프 데이터를 생성하는 방법은 무엇입니까?

M66 2025-06-07

많은 응용 프로그램 시나리오에서는 텍스트에 표시되는 각 단어의 빈도를 분석해야합니다. 일반적인 관행은 단어 주파수를 계산하고 단어 클라우드 맵을 생성하는 것입니다. Word Cloud Map은 텍스트에서 가장 일반적인 키워드를 빠르게 식별하는 데 도움이되는 직관적 인 표시 방법입니다. 이 기사에서는 PHP의 Array_Count_Values ​​함수를 사용하여 단어 주파수를 계산하고 Word Cloud 그래프에 필요한 데이터를 생성하는 방법을 소개합니다.

1. 기본 개념

먼저 몇 가지 개념을 이해해야합니다.

  • 단어 주파수 통계 : 즉, 각 단어가 텍스트에 나타나는 횟수를 계산합니다.

  • Word Cloud Diagram : 다른 글꼴 크기와 색상은 단어 발생 주파수를 나타냅니다. 주파수가 높을수록 글꼴이 클수록 색상이 더 밝습니다.

PHP에서 array_count_values ​​함수는 각 값이 배열에 나타나는 횟수를 쉽게 계산할 수 있습니다. 이것은 단어 주파수를 명시하는 데 매우 적합합니다.

2. 코드 구현

2.1 텍스트를 가져 와서 단어로 나눕니다

먼저 PHP의 내장 문자열 처리 기능을 사용하여 분할하여 단어 배열을 생성 할 수있는 텍스트가 있다고 가정 해 봅시다. 예를 들어, str_word_count 함수를 사용하여 텍스트에서 단어를 추출 할 수 있습니다.

 $text = "PHP널리 사용되는 오픈 소스 스크립팅 언어입니다。PHP주요 기능은 단순성입니다、유연한、배우기 쉽습니다。";
$words = str_word_count($text, 1);  // 1 반환 단어 배열을 나타냅니다

str_word_count는 텍스트를 단일 단어로 나누고 모든 단어가 포함 된 배열을 반환합니다.

2.2 통계 단어 주파수

다음으로 Array_Count_Values를 사용하여 각 단어가 배열에 나타나는 횟수를 계산할 수 있습니다.

 $word_count = array_count_values($words);
print_r($word_count);

Array_Count_Values는 연관 배열을 반환하고, 키는 단어이며, 값은 텍스트에 단어가 나타나는 횟수입니다. 예를 들어:

 Array
(
    [PHP] => 2
    [예] => 2
    [일종의] => 1
    [넓게] => 1
    [사용] => 1
    [~의] => 2
    [오픈 소스] => 1
    [스크립트] => 1
    [언어] => 1
    [기본] => 1
    [특징] => 1
    [간결한] => 1
    [유연한] => 1
    [쉬운] => 1
    [공부하다] => 1
)
2.3 단어 클라우드 맵 데이터 준비

단어 클라우드 맵의 데이터에는 일반적으로 단어와 주파수가 포함됩니다. Word Cloud 맵을 생성하려면 단어와 주파수 정보를 구성해야합니다. 이 데이터는 프론트 엔드와의 상호 작용을 위해 JSON 형식으로 저장할 수 있습니다.

 $word_cloud_data = [];
foreach ($word_count as $word => $count) {
    $word_cloud_data[] = [
        'text' => $word,
        'weight' => $count
    ];
}

$json_data = json_encode($word_cloud_data);

JSON_ENCODE는 배열을 JSON 형식으로 변환하며 반환 된 데이터는 프론트 엔드 JavaScript 코드에서 사용하여 Word 클라우드 다이어그램을 생성 할 수 있습니다.

2.4 단어 클라우드 다이어그램 렌더링

다음으로, 생성 된 Word 주파수 데이터를 API를 통해 프론트 엔드로 전달할 수 있습니다. API는 WordCloud.js 와 같은 JavaScript 라이브러리를 사용하여 Word Cloud Maps를 렌더링합니다. 인터페이스를 통해 PHP 백엔드에서 프론트 엔드로 데이터를 반환했다고 가정하면 Frontend JavaScript는 이러한 방식으로 데이터를 처리하고 Word Cloud 다이어그램을 생성 할 수 있습니다.

 <!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>단어 클라우드 다이어그램 디스플레이</title>
    <script src="https://m66.net/wordcloud.js"></script>
</head>
<body>
    <div id="wordcloud"></div>

    <script>
        const wordCloudData = <?php echo $json_data; ?>;

        WordCloud(document.getElementById('wordcloud'), {
            list: wordCloudData.map(item => [item.text, item.weight])
        });
    </script>
</body>
</html>

이 예에서 WordCloud.js는 PHP 백엔드에서 얻은 단어 주파수 데이터를 기반으로 Word Cloud 그래프를 생성합니다. 각 단어의 발생 빈도는 그림의 디스플레이 크기를 결정합니다.

3. 요약

php의 array_count_values ​​함수를 사용하면 텍스트에서 단어 주파수를 쉽게 계산하고 통계를 Word Cloud 그래프에 적합한 데이터 형식으로 변환 할 수 있습니다. 프론트 엔드 WordCloud.js 및 기타 라이브러리를 결합하여 Word Cloud 그래프 데이터를 표시하여 사용자에게 직관적 인 텍스트 분석 도구를 제공 할 수 있습니다.

이 기사가 PHP의 단어 주파수 통계를 신속하게 시작하고 Word 클라우드 다이어그램의 관련 작업을 생성하는 데 도움이되기를 바랍니다. 궁금한 점이 있으면 메시지를 남겨 두십시오.