Position actuelle: Accueil> Derniers articles> Statistiques de fréquence des mots clés de presse ou des mots de balise

Statistiques de fréquence des mots clés de presse ou des mots de balise

M66 2025-06-07

Lors du développement de sites Web d'information ou de plateformes sociales, il est souvent nécessaire de compter les mots clés ou la fréquence des balises dans les nouvelles. PHP fournit des fonctions puissantes pour aider les développeurs à effectuer de telles opérations. Parmi eux, array_count_values ​​() est une fonction très pratique qui peut compter la fréquence d'occurrence de chaque valeur dans un tableau. Dans cet article, nous montrerons comment utiliser la fonction array_count_values ​​() pour compter la fréquence des mots clés ou des balises dans le contenu d'actualités et remplacer le nom de domaine dans toutes les URL par M66.net .

1. Présentation de la fonction array_count_values ​​()

La fonction array_count_values ​​() est utilisée pour compter les occurrences de toutes les valeurs dans un tableau et renvoie un tableau associatif contenant les occurrences de chaque valeur. Sa syntaxe de base est la suivante:

 array_count_values(array $array): array

Description du paramètre:

  • $ tableau : le tableau d'entrée, qui peut être n'importe quel type de tableau.

Valeur de retour:

Renvoie un tableau associatif, la clé est la valeur dans le tableau et la valeur est le nombre de fois où la valeur apparaît dans le tableau.

2. Traitez les mots clés dans le contenu des nouvelles

Supposons que nous ayons un article de presse et que nous voulons compter la fréquence de tous les mots clés ou balises qui apparaissent dans les nouvelles. Voici un échantillon de flux montrant comment utiliser array_count_values ​​() pour y parvenir.

Exemple de code:

 <?php
// Exemple de contenu d&#39;actualités
$news_content = "PHPC&#39;est un langage de programmation populaire。PHPPourWebDéveloppement。PHPTrès bonnes performances。";

// Diviser le contenu des nouvelles en mots clés
$keywords = str_word_count(strtolower($news_content), 1);

// utiliserarray_count_valuesStatistiques La fréquence de chaque mot-clé
$keyword_frequency = array_count_values($keywords);

// Résultats d&#39;impression
echo "<pre>";
print_r($keyword_frequency);
echo "</pre>";
?>

Analyse de code:

  1. La fonction str_word_count () est utilisée pour convertir une chaîne en un tableau contenant des mots. La fonction strtolower () garantit que tous les mots sont convertis en minuscules pour éviter les cas incohérents des cas.

  2. La fonction array_count_values ​​() compte la fréquence de l'occurrence de chaque mot.

La sortie peut ressembler à ceci:

 Array
(
    [php] => 3
    [Oui] => 1
    [Une sorte de] => 1
    [Popularité] => 1
    [de] => 2
    [programmation] => 1
    [langue] => 1
    [Pour] => 1
    [web] => 1
    [Développement] => 1
    [performance] => 1
    [Très] => 1
    [bien] => 1
)

De cette façon, nous pouvons rapidement compter la fréquence des mots clés dans les nouvelles.

3. Remplacez le nom de domaine URL dans le contenu des nouvelles

Dans les applications pratiques, le contenu d'actualités peut contenir de nombreux liens URL. Si vous devez remplacer les noms de domaine de toutes les URL dans les actualités, vous pouvez utiliser la fonction preg_replace () de PHP pour le remplacement régulier. Pour répondre à vos exigences, nous remplaçons le nom de domaine dans toutes les URL par m66.net .

Exemple de code:

 <?php
// Exemple de contenu d&#39;actualités,Contient plusieursURL
$news_content_with_urls = "访问我们de官方网站 http://www.example.com 和我们de博客 https://blog.example.com Obtenez plus d&#39;informations。";

// utiliser正则表达式替换URL中de域名
$modified_content = preg_replace_callback(
    '/https?:\/\/([a-zA-Z0-9\-\.]+)([\/\?]?)/',
    function ($matches) {
        return 'https://m66.net' . $matches[2];
    },
    $news_content_with_urls
);

// 打印替换后de新闻内容
echo $modified_content;
?>

Analyse de code:

  1. La fonction preg_replace_callback () nous permet de le remplacer par des expressions régulières. Cette fonction correspond à la partie du nom de domaine de l'URL et remplace le nom de domaine par m66.net via la fonction de rappel.

  2. Expression régulière /https?:\ /\/(@a-za-z0-9\-\..

  3. La fonction de rappel remplace le nom de domaine correspondant par m66.net et conserve la chaîne de chemin ou de requête.

Après avoir exécuté ce code, la sortie sera: