インターネット アプリケーションの継続的な開発に伴い、システムはセンサー データ、ログ情報、株価などの時系列データをますます生成します。この種のデータは時間の連続性と高い成長を特徴としています。それをいかに効率的に検索・集約するかが重要な技術課題となっている。この記事では、RiSearch と PHP に基づいた高パフォーマンスの時系列データ検索および集計ソリューションを構築する方法を紹介します。
実装する前に、Redis、RiSearch、および PHP の Redis 拡張機能をインストールする必要があります。基本的な構成プロセスは次のとおりです。
RiSearch でのインデックスの使用は、検索と集計の基礎です。次の例は、PHP でログベースの時系列インデックスを作成する方法を示しています。
<?php $redis = new Redis(); $redis->接続('127.0.0.1', 6379); $redis->rawCommand('FT.CREATE', 'logs', 'SCHEMA', 'timestamp', 'NUMERIC', 'content', 'TEXT'); // インデックスにログ データを追加 $logs = array( array('timestamp' => 1615516800, 'content' => 'これが最初のログです'), array('timestamp' => 1615603200, 'content' => 'これは 2 番目のログです'), // ... ); foreach ($logs として $log) { $redis->rawCommand('FT.ADD', 'logs', 'doc:'.$log['timestamp'], 1.0, 'FIELDS', 'タイムスタンプ', $log['タイムスタンプ'], 'コンテンツ', $log['コンテンツ']); } ?>
上記のコードは、最初にlogsという名前のインデックスを定義します。このインデックスにはタイムスタンプとコンテンツの 2 つのフィールドが含まれており、後続の検索と集計操作を容易にするために複数のログ データをインデックスに書き込みます。
RiSearch は、時間間隔に基づいてデータを迅速に取得するための効率的なクエリ構文を提供します。次のコードは、指定した時間範囲内のログを検索する方法を示しています。
<?php $redis = new Redis(); $redis->接続('127.0.0.1', 6379); $query = '@timestamp:[1615516800 1615603200]'; // 2021-03-12 から 2021-03-13 までのログを検索 $result = $redis->rawCommand('FT.SEARCH', 'logs', $query, 'LIMIT', 0, 10); // 検索結果を出力 foreach ($result as $key => $value) { if ($key % 2 === 0) { echo 'ログ ID:'.$value."\n"; } それ以外 { echo 'コンテンツ:'.$value."\n"; } } ?>
FT.SEARCHコマンドを使用すると、時間範囲内のログ情報をすばやくクエリし、オンデマンドで結果を出力できます。このメソッドは、複雑なクエリ条件と複数フィールドの一致をサポートできます。
ログ分析または監視システムでは、集計統計が一般的な要件です。たとえば、特定の種類のログが特定の期間内に出現した回数をカウントできます。次の例は、RiSearch の集計コマンドを使用してこの機能を実現する方法を示しています。
<?php $redis = new Redis(); $redis->接続('127.0.0.1', 6379); $query = '@timestamp:[1615516800 1615603200]'; // 指定された時間範囲でログを検索 $result = $redis->rawCommand('FT.AGGREGATE', 'logs', $query, 'LOAD', 1, 'GROUPBY', 1, '@content', 'REDUCE'、'COUNT'、0、'AS'、'count'); // 集計結果をforeachに出力($result as $item) { echo 'コンテンツ:'.$item['@content'].'、出現頻度: '.$item['count']."\n"; } ?>
この集計コマンドは、クエリ結果をグループ化し、各ログ コンテンツの発生回数をカウントします。ログ分析やイベント統計などのシナリオに非常に適しています。
RiSearchとPHPを組み合わせることで、時系列データの検索・集計をサポートする高性能なシステムを簡単に構築できます。インデックス構築、検索クエリ、集計分析の3つのステップにより、大規模な時系列データを効率的に管理・分析できます。開発者は、データ視覚化、インテリジェントアラーム、多次元集計などの機能を追加するなど、実際のビジネスニーズに基づいてさらに拡張し、完全なデータ分析プラットフォームを構築できます。