ဆိုရှယ်မီဒီယာလျင်မြန်စွာဖွံ့ဖြိုးတိုးတက်မှုနှင့်အတူအသုံးပြုသူအချက်အလက်များသည်စီးပွားရေးနှင့်စျေးကွက်ရှာဖွေရေးတွင်မရှိမဖြစ်လိုအပ်သောအရင်းအမြစ်တစ်ခုဖြစ်လာသည်။ ယခင်ကလူမှုရေးပလက်ဖောင်းသုံးစွဲသူများနှင့်ပတ်သက်သောသတင်းအချက်အလက်များကိုစုဆောင်းခြင်းသည် modern နည်းပညာဆိုင်ရာအကူအညီများအတွက်လိုအပ်သော manual operations များကိုမကြာခဏလိုအပ်သည်။ ဤဆောင်းပါးသည် PHP နှင့် PPSPLER PHPSPLER မူဘောင်ကို အသုံးပြု. လူမှုရေးပလက်ဖောင်းများအပေါ်အသုံးပြုသူအချက်အလက်များကိုအလွယ်တကူတွားသွားနိုင်ကြောင်းလမ်းညွှန်ပါလိမ့်မည်။
ပထမ ဦး စွာ Phpspider Crawler tool ကို install လုပ်ရန်လိုအပ်သည်။ သငျသညျလျင်မြန်စွာ install လုပ်ဖို့ composer ကိုသုံးနိုင်ပါတယ်။ အောက်ပါ command ဖြင့် phpspider ပေါ်တွင် phpspider ကို install လုပ်ပါ။
တေးရေးဆရာ XXTMAME / PHSPSPIDER လိုအပ်သည်
တပ်ဆင်မှုပြီးဆုံးပြီးသောအခါကျွန်ုပ်တို့သည်လူမှုရေးပလက်ဖောင်းမှအသုံးပြုသူအချက်အလက်များကိုတွားသွားရန် Crawler scripts များကိုစတင်ရေးသားနိုင်သည်။ သင်၏စီမံကိန်းလမ်းညွှန်တွင် spider.php ဟုခေါ်သောဖိုင်တစ်ခုကိုဖန်တီးပြီးအောက်ပါကုဒ်ကိုကူးထည့်ပါ။
'ရောင်းချသူ / autoload.php လိုအပ်သည်'; phpspider \ core \ phpspider ကိုသုံးပါ။ phpspider \ core \ တောင်းဆိုမှုများကိုသုံးပါ။ တောင်းဆိုမှုများ :: set_header ('user-agent' 'mozilla / 5.0 (Windows NT 10.0; x64) Applewebkit / 537.36 (KHTML) Chrome / 89.0.4.438.8.82 / 537.438.82 saeck / 537.36 / 537.4389.82 / 537.48.82 sauck / 537.48.82 sauck / 537.36 / 537.4389.82 sauck / sauck / sauck / 537.36 / 537.4389.82 sauck / 537.36 sauck: $ configs = array ( 'NAME' => Socialymediaspider ', 'Domains' => Array ('Sent.com'), 'scan_urls' => array (https://xample.com/users), 'Content_URL_REAGEXExes' => array (https: \ / \ / ဥပမာ \ / users \ / +), 'list_URL_REAGEXEXESS' => array (https: \ / \ / ဥပမာ \ / users \? စာမျက်နှာ = D + / "), 'fields' => Array ( array ( 'NOME' => 'Username', 'selector' = >> "// div [@ class = 'username']" ), array ( 'name' => 'Email', 'selector' => "// div [@ class = '' »" ) ), ); $ spider = phpspider အသစ် ($ configs); $ spider-> on_extract_field = function ကို ($ fiatername, $ ဒေတာ, $ စာမျက်နှာ) { IF ($ fiatername == '' အီးမေးလ် ') { $ ဒေတာ = exploit (@ @ ', $ ဒေတာ); $ ဒေတာကိုပြန်ပို့ပါ [0] ။ '@ example example example example example;';; } $ ဒေတာများကိုပြန်သွားပါ။ }; $ spider-> start ();
အထက်ပါကုဒ်တွင်အမှန်တကယ်အခြေအနေများအရချိန်ညှိရန်လိုအပ်သည့်သော့ချက် configuration parameters များကိုသင်တွေ့နိုင်သည်။ ဥပမာအားဖြင့်, သင်ကတွားသွားသည့် URL, စာမျက်နှာအကြောင်းအရာ selector နှင့်တွားသွားရန်လိုအပ်သောလယ်ကွင်းများကိုသင်သတ်မှတ်ရန်လိုအပ်သည်။ အထူးသဖြင့်:
Code ကိုရေးပြီးပြီးတဲ့အခါ, crawler script ကိုအောက်ပါ command နဲ့ run လို့ရတယ်။
PHP Spider.php
ပြေးပြီးနောက်တွားသည်လူမှုရေးပလက်ဖောင်း၏အသုံးပြုသူအချက်အလက်များကိုအလိုအလျောက်တွားသွားလိမ့်မည်။ သင်၏လိုအပ်ချက်များနှင့်အညီအချက်အလက်များကိုထပ်မံခွဲခြမ်းစိတ်ဖြာ။ လုပ်ဆောင်နိုင်သည်။
PHP နှင့် ppspspider ကိုမြှင့်တင်ခြင်းအားဖြင့်သင်သည်လူမှုရေးမီဒီယာပလက်ဖောင်းများမှအသုံးပြုသူအချက်အလက်များကိုအလွယ်တကူတွားသွားနိုင်သည်။ ဤအလိုအလျောက်ချဉ်းကပ်နည်းသည်အချက်အလက်ရယူခြင်း၏ထိရောက်မှုကိုပိုမိုကောင်းမွန်စေသည်။ အချက်အလက်သိပ္ပံပညာရှင်များနှင့် developer များအတွက်အစွမ်းထက်သောကိရိယာများကိုများစွာပေးသည်။ ဟုတ်ပါတယ်, ဒေတာကိုဖမ်းယူဖို့တွားချင်တဲ့အချိန်မှာသက်ဆိုင်ရာဥပဒေတွေနဲ့စည်းမျဉ်းတွေကိုလိုက်နာဖို့သေချာစေပြီးမင်းရဲ့အပြုအမူကဥပဒေစည်းမျဉ်းစည်းကမ်းတွေနဲ့ကျင့်ဝတ်ဆိုင်ရာစံနှုန်းများကိုလိုက်နာဖို့သေချာစေပါ။