တရုတ်သို့မဟုတ်အခြား multibyte ဇာတ်ကောင်များနှင့်ဆက်ဆံရာတွင်သာမန် string ကိုအစားထိုးလုပ်ဆောင်ချက်များသည်အထူးသဖြင့်အထိခိုက်မခံသောစကားလုံး filtering ဆိုသည့်အခါနှစ်ချက် byte အက္ခရာများကိုမှန်ကန်စွာဖော်ထုတ်ရန်နှင့်ထုတ်လုပ်ရန်ပျက်ကွက်လေ့ရှိသည်။ PHP ရှိ MB_ereGi_replace function သည်အမှု၌အမှုဖွင့်ထားသောစာလုံးများပါ 0 င်သည့်စာလုံးပေါင်းစုံသောစာလုံးများကိုအစားထိုးရန်အကောင်းဆုံးစာလုံးများကိုမှန်ကန်စွာကိုင်တွယ်နိုင်သည့် MB_erebergi_erte-Safe ပုံမှန်အစားထိုးလုပ်ဆောင်ချက်တစ်ခုဖြစ်သည်။
အထိခိုက်မခံသောစကားလုံးများကိုစာသားတွင်အစားထိုးရန် MB_EREGI_replace ကို မည်သို့အသုံးပြုရမည်ကိုသရုပ်ပြရန်ဥပမာတစ်ခုရှိသည်။
<?php
// အတွင်းပိုင်းဇာတ်ကောင် encoding ကိုသတ်မှတ် UTF-8,Multibyte String function ကိုစနစ်တကျအလုပ်လုပ်ကြောင်းသေချာပါစေ
mb_internal_encoding("UTF-8");
// မူရင်းစာသား,အထိခိုက်မခံတရုတ်စကားလုံးများပါရှိသည်
$text = "ဒါကစမ်းသပ်မှုစာသားပါ,အထိခိုက်မခံစကားလုံးများပါဝင်သည်:အထိခိုက်မခံသောစကားများနှင့်မကောင်းတဲ့အကြောင်းအရာ。";
// အထိခိုက်မခံစကားလုံးများ၏စာရင်း(ပုံမှန်အသုံးအနှုန်းပုံစံများကိုပံ့ပိုးပေးပါ)
$sensitiveWords = [
"အထိခိုက်မခံစကားလုံးများ",
"မကောင်းတဲ့အကြောင်းအရာ"
];
// 替换အထိခိုက်မခံစကားလုံးများ为***
foreach ($sensitiveWords as $word) {
// အသုံးပြုmb_eregi_replaceဖြစ်ရပ် - အာရုံမခံစားနိုင်သောအစားထိုးပါစေ
$text = mb_eregi_replace($word, "***", $text);
}
echo $text;
?>
ရလဒ်များအစက်အပြောက်:
ဒါကစမ်းသပ်မှုစာသားပါ,အထိခိုက်မခံစကားလုံးများပါဝင်သည်:***နှင့်***。
Multi-byte လုံခြုံရေး
MB_eregi_replace သည် Multi-byte encoded strings များနှင့်ဆက်ဆံရာတွင်အထူးပြုသည့်ကိစ္စတွင်မခံစားနိုင်သော mb_ereg_replace ဗားရှင်းဖြစ်သည်။
အက်ခရာ encoding settings <br> MB_Internal_encoding ("UTF-8") ကို ပထမဆုံးခေါ်ဆိုရန်သို့မဟုတ် byte string ကိုပုံမှန်အသုံးပြုခြင်းကိုသေချာစေရန် EMF-8 သို့ script ကို UTF-8 သို့ encoded လုပ်ရန်လိုအပ်သည်။
<br> <br> ပုံမှန်အသုံးအနှုန်းများကိုပံ့ပိုးပေးပြီး fuzzy ကိုက်ညီခြင်းသို့မဟုတ် stemming နှင့်ကိုက်ညီမှုကဲ့သို့သောအထိခိုက်မခံသောစကားလုံးစည်းမျဉ်းများကိုပြောင်းလွယ်ပြင်လွယ်စွာသတ်မှတ်နိုင်သည်။
အထိခိုက်မခံတဲ့စကားလုံးတွေအများကြီးရှိရင်ဒေတာဘေ့စ် (သို့) ဖိုင်ထဲကအထိခိုက်မခံတဲ့စကားလုံးတွေစာရင်းကိုဖတ်ပြီးကွင်းထဲကိုအစားထိုးနိုင်ပါတယ်။ ၎င်းကိုအကြောင်းအရာများ၏လုံခြုံရေးကိုသေချာစေရန်အတွက်အထိခိုက်မခံသောစကားလုံးများကိုအချိန်မှန်အစားထိုးရန်အသုံးပြုသူ input ကိုပေါင်းစပ်။ ဖြည့်စွက်နိုင်သည်။