- ခြုံငုံသုံးသပ်ချက် -
ဝက်ဘ်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်အချက်အလက်ပြုပြင်ခြင်းများတွင်တိကျသောဒြပ်စင်များသို့မဟုတ်သတင်းအချက်အလက်များကိုထုတ်ယူရန် HTML သို့မဟုတ် XML စာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာရန်လိုအပ်သည်။ PHP သည်ဤလုပ်ငန်းစဉ်ကိုထိရောက်စေရန်နှင့်ရိုးရှင်းစေရန်အစွမ်းထက်သောလုပ်ဆောင်ချက်များနှင့်အတန်းများကိုပေးသည်။ ဤဆောင်းပါးသည် PHP တွင် HTML / XML စာရွက်စာတမ်းများကိုမည်သို့ခွဲခြမ်းစိတ်ဖြာနိုင်ကြောင်းနှင့်ဥပမာအားဖြင့်တိကျသောဒြပ်စင်များကိုမည်သို့ထုတ်ယူရမည်ကိုသရုပ်ပြပါမည်။
1 ။ parsing html / xml စာရွက်စာတမ်းများ
1 ။ Simplexml extension ကိုသုံးပါ။
Simplexml extension သည် XML စာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာရန်ရိုးရှင်းသောနှင့်အလိုလိုသိသောနည်းလမ်းဖြင့်ကျွန်ုပ်တို့ကိုပေးသည်။ ဤနေရာတွင် XML စာရွက်စာတမ်းများကို parml စာရွက်စာတမ်းများနှင့် Simplexml ကို အသုံးပြု. သတင်းအချက်အလက်များကိုထုတ်ယူခြင်းအတွက်နမူနာကုဒ်ဖြစ်သည်။
$ XMLString = ''<root><name> John Doe</name><age> 25</age></root> '';
$ XML = simplexml_load_string ($ XMLString);
$ အမည် = $ XML-> အမည်;
$ age = $ xml-> age;
ECHO "အမည်: $ အမည်, အသက် - အသက်အရွယ်";
2 ။ DOM extension ကိုသုံးပါ။
Dom extensions များသည် html / xml စာရွက်စာတမ်းများကိုခွဲခြမ်းနေသည့်အတွက် ပိုမို. ပြောင်းလွယ်ပြင်လွယ်ရှိသောနည်းလမ်းဖြစ်သည်။ အောက်ပါဥပမာသည် HTML စာရွက်စာတမ်းများကို dom extensions နှင့် Element Element များကိုထုတ်ယူနိုင်ကြောင်းပြသသည်။
$ htmlstring = ''<html><body><h1> မင်္ဂလာပါကမ္ဘာလောက</h1><p> ငါ၏အဝက်ဘ်ဆိုက်မှကြိုဆိုပါသည်</p><p> ယခု <a href="https://example.com">Php အခမဲ့လေ့လာမှုမှတ်စုများကို</a> <span>လေ့လာပါ</span></p></body></html> '';
$ dom = domDocument အသစ် ();
$ dom-> loadhtml ($ htmlstring);
$ headings = $ dom-> getelemscbytagname ('H1');
foreach ($ ခေါင်းစဉ်အဖြစ် $ ခေါင်းစဉ်များ) {
ECHO $ heading-> nodeevalue;
}
2 ။ လုပ်ငန်းစဉ် HTML / XML element များ
1 ။ ဒြပ်စင်၏အရာ attribute တွေကိုထုတ်ယူပါ။
HTML / XML ကိုခွဲခြမ်းစိတ်ဖြာသောအခါတိကျသောဒြပ်စင်၏ဂုဏ်သတ္တိများကိုထုတ်ယူရန်လိုအပ်သည်။ အောက်ပါဥပမာသည် Simplexml extension ကို အသုံးပြု. element properties ကိုမည်သို့ထုတ်ယူရမည်ကိုပြသသည်။
$ XMLString = ''<root><book title="အရေးယူအတွက် PHP" price="29.99" /></root> '';
$ XML = simplexml_load_string ($ XMLString);
$ ခေါင်းစဉ် = $ XML-> စာအုပ် ['TITTES'];
$ စျေးနှုန်း = $ XML-> စာအုပ် ['စျေးနှုန်း'];
ECHO "ခေါင်းစဉ်: $ ခေါင်းစဉ်, စျေးနှုန်း: $ စျေးနှုန်း";
2 ။ ဒြပ်စင်များနှင့်ကလေးသူငယ်များအပေါ်တွင်ကြားခံ
အကယ်. ကျွန်ုပ်တို့သည် element တစ်ခု၏ကလေးငယ်များ element အားလုံးကိုမှတစ်ဆင့်ကြားနာရန်လိုအပ်ပါကကျွန်ုပ်တို့သည် dom extension ကိုသုံးနိုင်သည်။ အောက်ဖော်ပြပါကုဒ်သည် HTML စာရွက်စာတမ်းတစ်ခုရှိ element အားလုံးကိုမည်သို့ရယူရမည်ကိုပြသသည်။
$ htmlstring = ''<html><h1> ခေါင်းစဉ် 1</h1><p> အပိုဒ် 1</p><h2> 2</h2><p> အပိုဒ် 2</p></html> ''; $ dom = domDocument အသစ် (); $ dom-> loadhtml ($ htmlstring); $ Element များ = $ dom-> GetelementsCBYSTagname ('*'); foreach ($ ဒြပ်စင်အဖြစ် $ elements) {echo $ element-> nodename ။ '': '' ။ $ element-> nodeevalue ။ '<br> ''; }
3 ။ XPath ကို သုံး. element element တွေကိုထုတ်ယူပါ။
XPath ကို HTML / XML စာရွက်စာတမ်းများရှိတိကျသော node များကိုရှာဖွေရန်အသုံးပြုသည်။ PHP ၏ domxpath အတန်းအစားသည် XPATH ကိုထောက်ပံ့ပေးသည်။ အောက်ဖော်ပြပါနမူနာကုဒ်သည် XPAPH Expression မှတဆင့် HTML document တွင်တိကျသော element များကိုမည်သို့ extract လုပ်ရမည်ကိုပြသသည်။
$ htmlstring = ''<html><div><h1> ခေါင်းစဉ် 1</h1><p> အပိုဒ် 1</p></div><div><h2> 2</h2><p> အပိုဒ် 2</p></div></html> '';
$ dom = domDocument အသစ် ();
$ dom-> loadhtml ($ htmlstring);
$ XPATH = DOMPATH ($ dom),
$ အပိုဒ် = $ xpath-> query ('// p');
foreach ($ စာပိုဒ်အဖြစ် $ အပိုဒ်) {
ECHO $ အပိုဒ် -> nodeevalalue ။ '<br> '';
}
နိဂုံးချုပ်အားဖြင့်:
PHP တွင် parsing နှင့် processing html / xml စာရွက်စာတမ်းများသည်အလွန်လက်တွေ့ကျပြီးဘုံလုပ်ငန်းဖြစ်သည်။ Simplexml နှင့် Dom extivity များကိုအသုံးပြုခြင်းအားဖြင့် developer များသည်တိကျသောသတင်းအချက်အလက်များကိုလျင်မြန်စွာထုတ်ယူနိုင်ပြီးဝက်ဘ်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်အချက်အလက်အပြောင်းအလဲများကိုများစွာတိုးတက်စေနိုင်သည်။ အထက်ပါဥပမာများနှင့်အတူရှုပ်ထွေးသော HTML / XML စာရွက်စာတမ်းများကိုကိုင်တွယ်ရန်ဤ PHP နည်းစနစ်များကိုမည်သို့ကျင့်သုံးရမည်ကိုပိုမိုနားလည်နိုင်သည်။