많은 응용 프로그램 시나리오에서는 텍스트에 표시되는 각 단어의 빈도를 분석해야합니다. 일반적인 관행은 단어 주파수를 계산하고 단어 클라우드 맵을 생성하는 것입니다. Word Cloud Map은 텍스트에서 가장 일반적인 키워드를 빠르게 식별하는 데 도움이되는 직관적 인 표시 방법입니다. 이 기사에서는 PHP의 Array_Count_Values 함수를 사용하여 단어 주파수를 계산하고 Word Cloud 그래프에 필요한 데이터를 생성하는 방법을 소개합니다.
먼저 몇 가지 개념을 이해해야합니다.
단어 주파수 통계 : 즉, 각 단어가 텍스트에 나타나는 횟수를 계산합니다.
Word Cloud Diagram : 다른 글꼴 크기와 색상은 단어 발생 주파수를 나타냅니다. 주파수가 높을수록 글꼴이 클수록 색상이 더 밝습니다.
PHP에서 array_count_values 함수는 각 값이 배열에 나타나는 횟수를 쉽게 계산할 수 있습니다. 이것은 단어 주파수를 명시하는 데 매우 적합합니다.
먼저 PHP의 내장 문자열 처리 기능을 사용하여 분할하여 단어 배열을 생성 할 수있는 텍스트가 있다고 가정 해 봅시다. 예를 들어, str_word_count 함수를 사용하여 텍스트에서 단어를 추출 할 수 있습니다.
$text = "PHP널리 사용되는 오픈 소스 스크립팅 언어입니다。PHP주요 기능은 단순성입니다、유연한、배우기 쉽습니다。";
$words = str_word_count($text, 1); // 1 반환 단어 배열을 나타냅니다
str_word_count는 텍스트를 단일 단어로 나누고 모든 단어가 포함 된 배열을 반환합니다.
다음으로 Array_Count_Values를 사용하여 각 단어가 배열에 나타나는 횟수를 계산할 수 있습니다.
$word_count = array_count_values($words);
print_r($word_count);
Array_Count_Values는 연관 배열을 반환하고, 키는 단어이며, 값은 텍스트에 단어가 나타나는 횟수입니다. 예를 들어:
Array
(
[PHP] => 2
[예] => 2
[일종의] => 1
[넓게] => 1
[사용] => 1
[~의] => 2
[오픈 소스] => 1
[스크립트] => 1
[언어] => 1
[기본] => 1
[특징] => 1
[간결한] => 1
[유연한] => 1
[쉬운] => 1
[공부하다] => 1
)
단어 클라우드 맵의 데이터에는 일반적으로 단어와 주파수가 포함됩니다. Word Cloud 맵을 생성하려면 단어와 주파수 정보를 구성해야합니다. 이 데이터는 프론트 엔드와의 상호 작용을 위해 JSON 형식으로 저장할 수 있습니다.
$word_cloud_data = [];
foreach ($word_count as $word => $count) {
$word_cloud_data[] = [
'text' => $word,
'weight' => $count
];
}
$json_data = json_encode($word_cloud_data);
JSON_ENCODE는 배열을 JSON 형식으로 변환하며 반환 된 데이터는 프론트 엔드 JavaScript 코드에서 사용하여 Word 클라우드 다이어그램을 생성 할 수 있습니다.
다음으로, 생성 된 Word 주파수 데이터를 API를 통해 프론트 엔드로 전달할 수 있습니다. API는 WordCloud.js 와 같은 JavaScript 라이브러리를 사용하여 Word Cloud Maps를 렌더링합니다. 인터페이스를 통해 PHP 백엔드에서 프론트 엔드로 데이터를 반환했다고 가정하면 Frontend JavaScript는 이러한 방식으로 데이터를 처리하고 Word Cloud 다이어그램을 생성 할 수 있습니다.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>단어 클라우드 다이어그램 디스플레이</title>
<script src="https://m66.net/wordcloud.js"></script>
</head>
<body>
<div id="wordcloud"></div>
<script>
const wordCloudData = <?php echo $json_data; ?>;
WordCloud(document.getElementById('wordcloud'), {
list: wordCloudData.map(item => [item.text, item.weight])
});
</script>
</body>
</html>
이 예에서 WordCloud.js는 PHP 백엔드에서 얻은 단어 주파수 데이터를 기반으로 Word Cloud 그래프를 생성합니다. 각 단어의 발생 빈도는 그림의 디스플레이 크기를 결정합니다.
php의 array_count_values 함수를 사용하면 텍스트에서 단어 주파수를 쉽게 계산하고 통계를 Word Cloud 그래프에 적합한 데이터 형식으로 변환 할 수 있습니다. 프론트 엔드 WordCloud.js 및 기타 라이브러리를 결합하여 Word Cloud 그래프 데이터를 표시하여 사용자에게 직관적 인 텍스트 분석 도구를 제공 할 수 있습니다.
이 기사가 PHP의 단어 주파수 통계를 신속하게 시작하고 Word 클라우드 다이어그램의 관련 작업을 생성하는 데 도움이되기를 바랍니다. 궁금한 점이 있으면 메시지를 남겨 두십시오.