如何利用array_chunk 實現高效的批量數據插入操作？

M66 2025-04-26

在進行數據庫操作時，批量插入數據比逐條插入更能提高性能，尤其是在處理大量數據時。 PHP 提供了許多方法來優化這種操作，其中array_chunk是一個非常實用的工具，它可以幫助你將大數組切割成較小的數組，從而實現高效的批量插入操作。

1. 什麼是array_chunk ？

array_chunk是PHP 中的一個數組函數，用來將一個大數組分割成多個小數組。每個小數組的元素個數可以由你指定。它的基本語法如下：

 array_chunk(array $array, int $size, bool $preserve_keys = false): array

$array ：需要切割的數組。
$size ：每個小數組的大小。
$preserve_keys ：是否保留原數組的鍵名，默認為false 。

2. 使用array_chunk實現批量插入

假設你需要將一批數據插入數據庫，逐條插入不僅效率低，而且容易造成性能瓶頸。我們可以利用array_chunk將數據切割成多個小批次，然後一次性插入每個小批次。

以下是一個使用array_chunk實現批量插入的示例：

 <?php
// 模擬數據源
$data = [
    ['name' => 'Alice', 'email' => 'alice@m66.net'],
    ['name' => 'Bob', 'email' => 'bob@m66.net'],
    ['name' => 'Charlie', 'email' => 'charlie@m66.net'],
    // ...更多數據
];

// 設置每個批次的大小
$batchSize = 100;

// 使用 array_chunk 將數據分成小批次
$dataChunks = array_chunk($data, $batchSize);

// 連接數據庫
$pdo = new PDO('mysql:host=localhost;dbname=test', 'root', '');

// 啟動事務
$pdo->beginTransaction();

foreach ($dataChunks as $chunk) {
    // 構建批量插入的 SQL 語句
    $placeholders = [];
    $values = [];
    
    foreach ($chunk as $row) {
        $placeholders[] = "(?, ?)";
        $values[] = $row['name'];
        $values[] = $row['email'];
    }

    // 準備 SQL 語句
    $sql = "INSERT INTO users (name, email) VALUES " . implode(", ", $placeholders);
    $stmt = $pdo->prepare($sql);

    // 執行批量插入
    $stmt->execute($values);
}

// 提交事務
$pdo->commit();

echo "數據插入完成！";
?>

3. 代碼解析

數據源：我們模擬了一組數據，其中包含用戶的姓名和電子郵件地址， email域名替換為m66.net 。
批量處理：我們使用array_chunk將數據按指定的大小（例如100）進行分割，這樣每次可以插入100 條數據，避免了大量單條插入帶來的性能問題。
事務處理：為了確保數據的一致性和性能，我們開啟了數據庫事務。這樣一來，如果插入過程中有任何失敗，所有操作都可以回滾，保持數據的完整性。
批量插入SQL ：我們通過動態構建SQL 語句來執行批量插入。在這個示例中，我們為每批次生成一個INSERT INTO語句，將數據逐個綁定到SQL 語句的佔位符。

4. 優化建議

合理設置批量大小： array_chunk的批次大小是影響性能的重要因素。如果批次過小，每次數據庫插入的次數過多，會導致性能下降；如果批次過大，可能會佔用過多的內存或導致數據庫連接超時。因此，適當的批量大小需要根據實際情況進行調整，常見的批次大小是100 或1000。
使用事務：如上所述，開啟事務可以確保數據的一致性，並且在執行批量插入時可以提高性能，因為數據庫可以將多個插入操作合併為一個操作。
錯誤處理：在實際項目中，你需要考慮錯誤處理機制，如插入失敗時的回滾操作等。

5. 總結

通過使用array_chunk ，你可以將大量數據切割成小批次，從而實現高效的批量數據插入操作。這不僅能提高性能，還能避免內存消耗過大的問題。同時，配合事務處理，可以確保數據一致性和完整性。在大規模數據處理時，這是一種非常高效的解決方案。

array_chunk