အင်တာနက်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်သတင်းအချက်အလက်ပေါက်ကွဲမှုခေတ်၏ခေတ်ကာလနှင့် ERA ၏ပေါ်ပေါက်လာခြင်းနှင့်အတူပြည့်စုံသောရှာဖွေရေးအင်ဂျင်များသည်သတင်းအချက်အလက်ရှာဖွေခြင်းအတွက်အရေးကြီးသောကိရိယာတစ်ခုဖြစ်လာသည်။ ရိုးရာစာသားအပြည့်အစုံကိုရှာဖွေရေးအင်ဂျင်များသည်များသောအားဖြင့်အင်္ဂလိပ်ကဲ့သို့သောအနောက်တိုင်းဘာသာရပ်များအတွက်အကောင်းဆုံးဖြစ်သည်။ သို့သော်တရုတ်နိုင်ငံသည်အပြောင်းအလဲအတွက်ထူးခြားသောပြ problems နာများရှိသည်။ ဤဆောင်းပါးသည် Sphinx PHP ကိုတရုတ်စကားလုံး၏ segmentation နှင့်ပြန်လည်ရယူခြင်းကိုပြန်လည်ပြုပြင်ခြင်းကိုအကောင်အထည်ဖော်ရန်မည်သို့အသုံးပြုရမည်ကိုအသေးစိတ်မိတ်ဆက်ပေးပြီးသက်ဆိုင်ရာကုဒ်များဥပမာများကိုပေးသည်။
တရုတ်စကားလုံးပါ 0 င်မှုဆိုသည်မှာတရုတ်စာသားအပြည့်အစုံကိုရှာဖွေသောတရုတ်စာသားအပြည့်အစုံကိုရှာဖွေခြင်း၏အဓိက link တစ်ခုဖြစ်သည်။ ရိုးရာစာသား full-text search engin များတွင် Search သည်စကားလုံးကြိမ်နှုန်းကို အခြေခံ. Inverted Inverexes မှတဆင့်ရှာဖွေသည်။
Sphinx PHP သည်တရုတ်စကားလုံး၏ segmenter extension extension extension extension extension extension extension extension extension extension extension တစ်ခုဖြစ်ပြီး, ဤတွင်တရုတ်စကားလုံး၏ segmentation အတွက် Sphinxsegs ကိုသုံးပြီးဥပမာကုဒ်ဖြစ်သည်။
<?php $seg = sphinxsegs_initial(); sphinxsegs_setencoding($seg, 'utf-8'); sphinxsegs_setwordlist($seg, 'path/to/wordlist.dic'); $text = 'တရုတ်အပြည့်အဝစာသားရှာဖွေရေးအင်ဂျင်'; $result = sphinxsegs_segment($seg, $text); print_r($result); sphinxsegs_close($seg); ?>
အထက်ပါကုဒ်တွင်တရုတ်စကားလုံး၏ segmenter ကို sphinxsegs_initial function မှတဆင့်ပထမ ဦး ဆုံးကို sphinxsegs_initial function မှတဆင့်ပထမ ဦး ဆုံးကို sphinxsegs_seting မှတဆင့် utf-8 ကိုသတ်မှတ်ထားပြီး, နောက်ဆုံးအနေဖြင့် sphinxsegs_segment ကို သုံး. sphinxsegs_segment ကို သုံး. ပြီးစီးပြီးနောက် Segmentation ဟူသောစကားလုံးကိုပိတ်ပါ။
တရုတ်စာသားကိုပြန်လည်ရယူခြင်း, ဥပမာအားဖြင့်စကားလုံးများရှာဖွေခြင်းနှင့်တိကျမှု၏ပြန်လည်ထူထောင်ခြင်းနှင့်တိကျမှုတိုးတက်စေရန်အတွက်ကျွန်ုပ်တို့သည်ထူးခြားသောပြ problems နာအချို့ရှိသည်။
Sphinx PHPP သည်ပြန်လည်ထုတ်ယူခြင်း, အလေးချိန်နည်းခြင်း,
<?php require('sphinxapi.php'); $cl = new SphinxClient(); $cl-> Setserver ('localhost', 9312); $ clo-> setmatchmode (sph_match_extended2); $ Cl-> setfiledeights (array ('ခေါင်းစဉ်) => 10,' Content '=> 1); $ သော့ချက်စာလုံးများ = 'တရုတ်အပြည့်အ 0 စာသားရှာဖွေရေးအင်ဂျင်', $ ရလဒ် = $ CL-> query ($ သော့ချက်စာလုံးများ, Index_Name '); Print_R ($ ရလဒ်); IF ($ ရလဒ် && $ ရလဒ် ['စုစုပေါင်း']> 0) { foreach ($ ရလဒ် ['ကိုက်ညီ] $ ပွဲစဉ်အဖြစ်) { ECHO 'ID:' ။ $ ကိုက်ညီ ['ID'] ။ ''; အလေးချိန်: '' ။ $ ကိုက်ညီ [အလေးချိန် '] ။ ''; attribute:: ':' ။ $ ကိုက်ညီ ['attribs'] ['title'] ။ php_eol; } } >
ဤကုဒ်တွင် Sphinx PHP 0 န်ဆောင်မှုစာကြည့်တိုက် sphinxapi.php ကိုမိတ်ဆက်ပေးခြင်းဖြင့် SPHINX ဆာဗာ၏လိပ်စာနှင့်ဆိပ်ကမ်းကို sphinx sphinx sphinx and port ကို sphinx sphinx sphinxtended2 ကိုသတ်မှတ်ခြင်း, ထို့နောက်ရှာဖွေရေးသော့ချက်စာလုံးများကိုသတ်မှတ်ပြီးရှာဖွေခြင်း function ကိုရှာဖွေရန်ခေါ်ဆိုပါ။ နောက်ဆုံးအနေဖြင့်၎င်းကိုပြန်လာသောရလဒ်မှတစ်ဆင့်လုပ်ဆောင်သည်။
ဒီဆောင်းပါးက Sphinx PHPP ကိုတရုတ်စကားလုံး segmentation နဲ့ revieving optimization ကိုအကောင်အထည်ဖော်ဖို့ဘယ်လိုသုံးရမလဲဆိုတာကိုမိတ်ဆက်ပေးပြီးတိကျတဲ့ကုဒ်တွေကိုဥပမာပေးတယ်။ Sphinx PHP ၏တရုတ်စကားလုံးအပိုင်းအစ Segmenter နှင့် Search Optimization Function ကိုအသုံးပြုခြင်းအားဖြင့် developer များသည်သိသိသာသာစာသားအပြည့်အစုံရှာဖွေမှု၏ထိရောက်မှုကိုသိသိသာသာတိုးတက်စေနိုင်သည်။ ဤဆောင်းပါးသည်တရုတ်ဘာသာဖြင့်စာသားအပြည့်ရှာဖွေရန်လိုအပ်သော developer များထံမှအထောက်အကူပြုလိမ့်မည်ဟုကျွန်ုပ်မျှော်လင့်ပါသည်။