處理大數組時如何高效使用array_chunk？避免性能瓶頸的方法有哪些？

M66 2025-04-26

在開發過程中，處理大量數據時經常需要將一個大數組分割成多個小數組。 PHP 提供了一個非常有用的函數array_chunk()來進行數組分割。這個函數能夠將一個大的數組拆分成多個小數組，適用於各種場景，如分頁、批量處理等。儘管array_chunk()非常方便，但在處理大數組時，如果不加以優化，可能會導致性能瓶頸。本文將介紹如何高效地使用array_chunk() ，並探討避免性能問題的方法。

1. array_chunk()函數的基本使用

array_chunk()函數用於將一個數組分割成多個小數組，返回一個包含小數組的二維數組。

基本語法：

 array_chunk(array $array, int $size, bool $preserve_keys = false): array

$array : 需要被分割的數組。
$size : 每個小數組的大小。
$preserve_keys : 如果設置為true ，將保留原數組的鍵名；如果為false ，將重新索引鍵名。

示例代碼：

 <?php
$array = range(1, 20);  // 生成一個包含 1 到 20 的數組
$chunked = array_chunk($array, 5);

print_r($chunked);
?>

輸出結果：

 Array
(
    [0] => Array ( [0] => 1 [1] => 2 [2] => 3 [3] => 4 [4] => 5 )
    [1] => Array ( [0] => 6 [1] => 7 [2] => 8 [3] => 9 [4] => 10 )
    [2] => Array ( [0] => 11 [1] => 12 [2] => 13 [3] => 14 [4] => 15 )
    [3] => Array ( [0] => 16 [1] => 17 [2] => 18 [3] => 19 [4] => 20 )
)

這種方式對小數組非常有效，但如果處理的是一個非常大的數組，性能問題就會逐漸顯現。

2. 處理大數組時的性能問題

當數組非常大時，直接使用array_chunk()可能會導致內存佔用過高，進而影響性能。原因主要有以下幾點：

內存佔用： array_chunk()會創建多個新的數組副本，這可能會導致內存使用急劇增加。
不必要的鍵名重建：如果$preserve_keys參數為false ，每個小數組都會重新索引鍵名，增加了額外的計算開銷。

對於大數組，如果沒有優化，性能瓶頸會特別明顯，甚至可能導致程序崩潰或響應緩慢。

3. 避免性能瓶頸的優化方法

在處理大數組時，為了避免性能瓶頸，我們可以採取以下優化措施：

3.1 使用array_slice()代替array_chunk()

array_slice()函數能夠在不復制整個數組的情況下，從數組中提取子數組。相比於array_chunk() ， array_slice()允許我們按需處理數組中的部分數據，避免了一次性處理整個大數組的內存佔用。

優化示例：

 <?php
$array = range(1, 1000000);  // 假設我們有一個包含百萬個元素的大數組
$chunk_size = 10000;  // 每次處理 10000 個元素

// 使用 array_slice 遍歷大數組
for ($i = 0; $i < count($array); $i += $chunk_size) {
    $chunk = array_slice($array, $i, $chunk_size);
    // 處理 $chunk 數據，例如發送 HTTP 請求等
    // 假設請求 URL 為 https://m66.net/api/data
    file_get_contents("https://m66.net/api/data?data=" . urlencode(json_encode($chunk)));
}
?>

使用array_slice()遍歷大數組時，每次只處理固定大小的一部分數據，這樣可以有效減少內存佔用，避免一次性加載過多數據導致的性能問題。

3.2 減少不必要的鍵名重建

如前所述， array_chunk()的preserve_keys參數會影響內存使用。如果我們不需要保留鍵名，最好將該參數設置為false ，以減少內存佔用。

 <?php
$array = range(1, 1000000);
$chunked = array_chunk($array, 10000, false);  // 不保留原始鍵名
?>

這樣做會使得每個小數組的鍵名重新索引，減少了不必要的內存開銷。

3.3 批量處理與分段處理

對於超大數組，最好的方式是將其分段處理。通過循環分段批量處理數據，可以將大數組分成多個小塊進行逐個處理，從而減少內存壓力。

批量處理示例：

 <?php
$array = range(1, 1000000);  // 大數組
$chunk_size = 50000;  // 每批次處理 50000 个數據

foreach (array_chunk($array, $chunk_size) as $chunk) {
    // 逐批處理數據，例如發起 API 請求
    file_get_contents("https://m66.net/api/data?data=" . urlencode(json_encode($chunk)));
}
?>

這種方式通過分段處理，可以防止一次性加載過多數據到內存中，提高程序的穩定性和性能。