လက်ရှိတည်နေရာ: ပင်မစာမျက်နှာ> နောက်ဆုံးရဆောင်းပါးများစာရင်း> PHP အတွက် PHP အတွက်အပြည့်အဝသင်ခန်းစာ html / xml စာရွက်စာတမ်းများနှင့်တိကျသောဒြပ်စင်များထုတ်ယူခြင်း

PHP အတွက် PHP အတွက်အပြည့်အဝသင်ခန်းစာ html / xml စာရွက်စာတမ်းများနှင့်တိကျသောဒြပ်စင်များထုတ်ယူခြင်း

M66 2025-06-17

- ခြုံငုံသုံးသပ်ချက် -

ဝက်ဘ်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်အချက်အလက်ပြုပြင်ခြင်းများတွင်တိကျသောဒြပ်စင်များသို့မဟုတ်သတင်းအချက်အလက်များကိုထုတ်ယူရန် HTML သို့မဟုတ် XML စာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာရန်လိုအပ်သည်။ PHP သည်ဤလုပ်ငန်းစဉ်ကိုထိရောက်စေရန်နှင့်ရိုးရှင်းစေရန်အစွမ်းထက်သောလုပ်ဆောင်ချက်များနှင့်အတန်းများကိုပေးသည်။ ဤဆောင်းပါးသည် PHP တွင် HTML / XML စာရွက်စာတမ်းများကိုမည်သို့ခွဲခြမ်းစိတ်ဖြာနိုင်ကြောင်းနှင့်ဥပမာအားဖြင့်တိကျသောဒြပ်စင်များကိုမည်သို့ထုတ်ယူရမည်ကိုသရုပ်ပြပါမည်။

1 ။ parsing html / xml စာရွက်စာတမ်းများ

1 ။ Simplexml extension ကိုသုံးပါ။

Simplexml extension သည် XML စာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာရန်ရိုးရှင်းသောနှင့်အလိုလိုသိသောနည်းလမ်းဖြင့်ကျွန်ုပ်တို့ကိုပေးသည်။ ဤနေရာတွင် XML စာရွက်စာတမ်းများကို parml စာရွက်စာတမ်းများနှင့် Simplexml ကို အသုံးပြု. သတင်းအချက်အလက်များကိုထုတ်ယူခြင်းအတွက်နမူနာကုဒ်ဖြစ်သည်။
$ XMLString = &#39;&#39;<root><name> John Doe</name><age> 25</age></root> &#39;&#39;;
$ XML = simplexml_load_string ($ XMLString);
$ အမည် = $ XML-> အမည်;
$ age = $ xml-> age;
ECHO "အမည်: $ အမည်, အသက် - အသက်အရွယ်";

2 ။ DOM extension ကိုသုံးပါ။

Dom extensions များသည် html / xml စာရွက်စာတမ်းများကိုခွဲခြမ်းနေသည့်အတွက် ပိုမို. ပြောင်းလွယ်ပြင်လွယ်ရှိသောနည်းလမ်းဖြစ်သည်။ အောက်ပါဥပမာသည် HTML စာရွက်စာတမ်းများကို dom extensions နှင့် Element Element များကိုထုတ်ယူနိုင်ကြောင်းပြသသည်။
$ htmlstring = &#39;&#39;<html><body><h1> မင်္ဂလာပါကမ္ဘာလောက</h1><p> ငါ၏အဝက်ဘ်ဆိုက်မှကြိုဆိုပါသည်</p><p> ယခု <a href="https://example.com">Php အခမဲ့လေ့လာမှုမှတ်စုများကို</a> <span>လေ့လာပါ</span></p></body></html> &#39;&#39;;
$ dom = domDocument အသစ် ();
$ dom-> loadhtml ($ htmlstring);
$ headings = $ dom-> getelemscbytagname (&#39;H1&#39;);
foreach ($ ခေါင်းစဉ်အဖြစ် $ ခေါင်းစဉ်များ) {
    ECHO $ ​​heading-> nodeevalue;
}

2 ။ လုပ်ငန်းစဉ် HTML / XML element များ

1 ။ ဒြပ်စင်၏အရာ attribute တွေကိုထုတ်ယူပါ။

HTML / XML ကိုခွဲခြမ်းစိတ်ဖြာသောအခါတိကျသောဒြပ်စင်၏ဂုဏ်သတ္တိများကိုထုတ်ယူရန်လိုအပ်သည်။ အောက်ပါဥပမာသည် Simplexml extension ကို အသုံးပြု. element properties ကိုမည်သို့ထုတ်ယူရမည်ကိုပြသသည်။
$ XMLString = &#39;&#39;<root><book title="အရေးယူအတွက် PHP" price="29.99" /></root> &#39;&#39;;
$ XML = simplexml_load_string ($ XMLString);
$ ခေါင်းစဉ် = $ XML-> စာအုပ် [&#39;TITTES&#39;];
$ စျေးနှုန်း = $ XML-> စာအုပ် [&#39;စျေးနှုန်း&#39;];
ECHO "ခေါင်းစဉ်: $ ခေါင်းစဉ်, စျေးနှုန်း: $ စျေးနှုန်း";

2 ။ ဒြပ်စင်များနှင့်ကလေးသူငယ်များအပေါ်တွင်ကြားခံ

အကယ်. ကျွန်ုပ်တို့သည် element တစ်ခု၏ကလေးငယ်များ element အားလုံးကိုမှတစ်ဆင့်ကြားနာရန်လိုအပ်ပါကကျွန်ုပ်တို့သည် dom extension ကိုသုံးနိုင်သည်။ အောက်ဖော်ပြပါကုဒ်သည် HTML စာရွက်စာတမ်းတစ်ခုရှိ element အားလုံးကိုမည်သို့ရယူရမည်ကိုပြသသည်။
$ htmlstring = &#39;&#39;<html><h1> ခေါင်းစဉ် 1</h1><p> အပိုဒ် 1</p><h2> 2</h2><p> အပိုဒ် 2</p></html> &#39;&#39;; $ dom = domDocument အသစ် (); $ dom-> loadhtml ($ htmlstring); $ Element များ = $ dom-> GetelementsCBYSTagname (&#39;*&#39;); foreach ($ ဒြပ်စင်အဖြစ် $ elements) {echo $ element-> nodename ။ &#39;&#39;: &#39;&#39; ။ $ element-> nodeevalue ။ &#39;<br> &#39;&#39;; }

3 ။ XPath ကို သုံး. element element တွေကိုထုတ်ယူပါ။

XPath ကို HTML / XML စာရွက်စာတမ်းများရှိတိကျသော node များကိုရှာဖွေရန်အသုံးပြုသည်။ PHP ၏ domxpath အတန်းအစားသည် XPATH ကိုထောက်ပံ့ပေးသည်။ အောက်ဖော်ပြပါနမူနာကုဒ်သည် XPAPH Expression မှတဆင့် HTML document တွင်တိကျသော element များကိုမည်သို့ extract လုပ်ရမည်ကိုပြသသည်။
$ htmlstring = &#39;&#39;<html><div><h1> ခေါင်းစဉ် 1</h1><p> အပိုဒ် 1</p></div><div><h2> 2</h2><p> အပိုဒ် 2</p></div></html> &#39;&#39;;
$ dom = domDocument အသစ် ();
$ dom-> loadhtml ($ htmlstring);
$ XPATH = DOMPATH ($ dom),
$ အပိုဒ် = $ xpath-> query (&#39;// p&#39;);
foreach ($ စာပိုဒ်အဖြစ် $ အပိုဒ်) {
    ECHO $ ​​အပိုဒ် -> nodeevalalue ။ &#39;<br> &#39;&#39;;
}

နိဂုံးချုပ်အားဖြင့်:

PHP တွင် parsing နှင့် processing html / xml စာရွက်စာတမ်းများသည်အလွန်လက်တွေ့ကျပြီးဘုံလုပ်ငန်းဖြစ်သည်။ Simplexml နှင့် Dom extivity များကိုအသုံးပြုခြင်းအားဖြင့် developer များသည်တိကျသောသတင်းအချက်အလက်များကိုလျင်မြန်စွာထုတ်ယူနိုင်ပြီးဝက်ဘ်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်အချက်အလက်အပြောင်းအလဲများကိုများစွာတိုးတက်စေနိုင်သည်။ အထက်ပါဥပမာများနှင့်အတူရှုပ်ထွေးသော HTML / XML စာရွက်စာတမ်းများကိုကိုင်တွယ်ရန်ဤ PHP နည်းစနစ်များကိုမည်သို့ကျင့်သုံးရမည်ကိုပိုမိုနားလည်နိုင်သည်။