လက်ရှိတည်နေရာ: ပင်မစာမျက်နှာ> နောက်ဆုံးရဆောင်းပါးများစာရင်း> စာသားထဲမှာ double-byte အက္ခရာများပါသောအထိခိုက်မခံသောစကားလုံးများကိုအစားထိုးရန် MB_ereGi_replace function ကိုမည်သို့အသုံးပြုရမည်နည်း။

စာသားထဲမှာ double-byte အက္ခရာများပါသောအထိခိုက်မခံသောစကားလုံးများကိုအစားထိုးရန် MB_ereGi_replace function ကိုမည်သို့အသုံးပြုရမည်နည်း။

M66 2025-06-11

တရုတ်သို့မဟုတ်အခြား multibyte ဇာတ်ကောင်များနှင့်ဆက်ဆံရာတွင်သာမန် string ကိုအစားထိုးလုပ်ဆောင်ချက်များသည်အထူးသဖြင့်အထိခိုက်မခံသောစကားလုံး filtering ဆိုသည့်အခါနှစ်ချက် byte အက္ခရာများကိုမှန်ကန်စွာဖော်ထုတ်ရန်နှင့်ထုတ်လုပ်ရန်ပျက်ကွက်လေ့ရှိသည်။ PHP ရှိ MB_ereGi_replace function သည်အမှု၌အမှုဖွင့်ထားသောစာလုံးများပါ 0 င်သည့်စာလုံးပေါင်းစုံသောစာလုံးများကိုအစားထိုးရန်အကောင်းဆုံးစာလုံးများကိုမှန်ကန်စွာကိုင်တွယ်နိုင်သည့် MB_erebergi_erte-Safe ပုံမှန်အစားထိုးလုပ်ဆောင်ချက်တစ်ခုဖြစ်သည်။

အထိခိုက်မခံသောစကားလုံးများကိုစာသားတွင်အစားထိုးရန် MB_EREGI_replace ကို မည်သို့အသုံးပြုရမည်ကိုသရုပ်ပြရန်ဥပမာတစ်ခုရှိသည်။

 <?php
// အတွင်းပိုင်းဇာတ်ကောင် encoding ကိုသတ်မှတ် UTF-8,Multibyte String function ကိုစနစ်တကျအလုပ်လုပ်ကြောင်းသေချာပါစေ
mb_internal_encoding("UTF-8");

// မူရင်းစာသား,အထိခိုက်မခံတရုတ်စကားလုံးများပါရှိသည်
$text = "ဒါကစမ်းသပ်မှုစာသားပါ,အထိခိုက်မခံစကားလုံးများပါဝင်သည်:အထိခိုက်မခံသောစကားများနှင့်မကောင်းတဲ့အကြောင်းအရာ。";

// အထိခိုက်မခံစကားလုံးများ၏စာရင်း(ပုံမှန်အသုံးအနှုန်းပုံစံများကိုပံ့ပိုးပေးပါ)
$sensitiveWords = [
    "အထိခိုက်မခံစကားလုံးများ",
    "မကောင်းတဲ့အကြောင်းအရာ"
];

// 替换အထိခိုက်မခံစကားလုံးများ为***
foreach ($sensitiveWords as $word) {
    // အသုံးပြုmb_eregi_replaceဖြစ်ရပ် - အာရုံမခံစားနိုင်သောအစားထိုးပါစေ
    $text = mb_eregi_replace($word, "***", $text);
}

echo $text;
?>

ရလဒ်များအစက်အပြောက်:

 ဒါကစမ်းသပ်မှုစာသားပါ,အထိခိုက်မခံစကားလုံးများပါဝင်သည်:***နှင့်***。

အဓိကမှတ်စုများ

  1. Multi-byte လုံခြုံရေး
    MB_eregi_replace သည် Multi-byte encoded strings များနှင့်ဆက်ဆံရာတွင်အထူးပြုသည့်ကိစ္စတွင်မခံစားနိုင်သော mb_ereg_replace ဗားရှင်းဖြစ်သည်။

  2. အက်ခရာ encoding settings <br> MB_Internal_encoding ("UTF-8") ကို ပထမဆုံးခေါ်ဆိုရန်သို့မဟုတ် byte string ကိုပုံမှန်အသုံးပြုခြင်းကိုသေချာစေရန် EMF-8 သို့ script ကို UTF-8 သို့ encoded လုပ်ရန်လိုအပ်သည်။

  3. <br> <br> ပုံမှန်အသုံးအနှုန်းများကိုပံ့ပိုးပေးပြီး fuzzy ကိုက်ညီခြင်းသို့မဟုတ် stemming နှင့်ကိုက်ညီမှုကဲ့သို့သောအထိခိုက်မခံသောစကားလုံးစည်းမျဉ်းများကိုပြောင်းလွယ်ပြင်လွယ်စွာသတ်မှတ်နိုင်သည်။

တိုးချဲ့လျှောက်လွှာ

အထိခိုက်မခံတဲ့စကားလုံးတွေအများကြီးရှိရင်ဒေတာဘေ့စ် (သို့) ဖိုင်ထဲကအထိခိုက်မခံတဲ့စကားလုံးတွေစာရင်းကိုဖတ်ပြီးကွင်းထဲကိုအစားထိုးနိုင်ပါတယ်။ ၎င်းကိုအကြောင်းအရာများ၏လုံခြုံရေးကိုသေချာစေရန်အတွက်အထိခိုက်မခံသောစကားလုံးများကိုအချိန်မှန်အစားထိုးရန်အသုံးပြုသူ input ကိုပေါင်းစပ်။ ဖြည့်စွက်နိုင်သည်။