လက်ရှိတည်နေရာ: ပင်မစာမျက်နှာ> နောက်ဆုံးရဆောင်းပါးများစာရင်း> HTML နှင့် XML စာရွက်စာတမ်းများ process လုပ်ရန် PHP တွင် dom parsing ကို အသုံးပြု. အပြည့်အစုံသင်ခန်းစာ

HTML နှင့် XML စာရွက်စာတမ်းများ process လုပ်ရန် PHP တွင် dom parsing ကို အသုံးပြု. အပြည့်အစုံသင်ခန်းစာ

M66 2025-07-30

HTML နှင့် XML စာရွက်စာတမ်းများ process လုပ်ရန် PHP တွင် dom parsing ကို အသုံးပြု. အပြည့်အစုံသင်ခန်းစာ

ဝက်ဘ်ဖွံ့ဖြိုးတိုးတက်မှုတွင် html သို့မဟုတ် xml စာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာခြင်းနှင့်ပြုပြင်ခြင်းသည်ဘုံလိုအပ်ချက်ဖြစ်သည်။ developer များလည်ပတ်ရန်နှင့်ဤစာရွက်စာတမ်းများကိုထိရောက်စွာလုပ်ဆောင်ရန် PHP သည် Dom (စာရွက်စာတမ်း Object Model) နည်းပညာကိုထောက်ပံ့ပေးသည်။ Dom သည်စာရွက်စာတမ်းများကိုသစ်ပင်များမှတဆင့်စာရွက်စာတမ်းများကိုကိုယ်စားပြုသောပလက်ဖောင်း - လွတ်လပ်သော API တစ်ခုဖြစ်သည်။ စာရွက်စာတမ်း node များကိုပေါင်းထည့်ခြင်း, ဖျက်ခြင်း, ရှာဖွေခြင်းနှင့်ရှာဖွေခြင်းတို့ကိုထောက်ပံ့သည်။

ဒီသင်ခန်းစာတွင် dom ကို အသုံးပြု. HTML / XML စာရွက်စာတမ်းများကိုမည်သို့ခွဲခြမ်းစိတ်ဖြာခြင်းနှင့်လုပ်ငန်းစဉ်ကိုထုတ်ယူခြင်းကိုပြသရန်အတွက်ရိုးရှင်းသော PHP PHP ကိုအသုံးပြုပါမည်။

Dom parsing ဥပမာ

ကျွန်ုပ်တို့တွင်ရိုးရှင်းသော tags များနှင့်အကြောင်းအရာအချို့ပါ 0 င်သည့်အောက်ပါ HTML စာရွက်စာတမ်းရှိသည်ဆိုပါစို့။

 <!DOCTYPE html>
<html>
  <head>
    <title>နမူနာစာရွက်စာတမ်းများ</title>
  </head>
  <body>
    <h1>ဝမ်းသာစွာနှုတ်ဆက်ခြင်းDOMသုံးသပ်ချက်ဥပမာ</h1>
    <ul>
      <li><a href="https://www.example.com">ဥပမာ link1</a></li>
      <li><a href="https://www.example.com">ဥပမာ link2</a></li>
      <li><a href="https://www.example.com">ဥပမာ link3</a></li>
    </ul>
  </body>
</html>

ကျွန်ုပ်တို့၏ရည်မှန်းချက်မှာ PHP script မှတဆင့်ဤ HTML document ကိုခွဲထုတ်ရန်,

PHP Code Pegion

PHP DM Object ကို အသုံးပြု. အထက်ဖော်ပြပါ HTML စာရွက်စာတမ်းကိုခွဲခြမ်းစိတ်ဖြာရန်ကုဒ်နံပါတ်ဖြစ်သည်။

 <?php
// aDOMကန့်ကွက်
$dom = new DOMDocument();

// ဝန်တင်HTMLစာချုပ်စာတမ်း
$dom->loadHTMLFile('example.html');

// အားလုံးရယူပါh1ကပ်တံဆိပ်
$headings = $dom->getElementsByTagName('h1');
foreach ($headings as $heading) {
    echo 'ဘဲှ့: ' . $heading->nodeValue . '<br>';
}

// အားလုံးရယူပါaကပ်တံဆိပ်
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
    echo 'သံကွင်းဆက်: ' . $link->getAttribute('href') . '<br>';
}
?>

Code output ရလဒ်

အထက်ပါကုဒ်ကိုဖွင့်သောအခါ, output ရလဒ်သည်အောက်ပါအတိုင်းဖြစ်သည် -

 ဘဲှ့: ဝမ်းသာစွာနှုတ်ဆက်ခြင်းDOMသုံးသပ်ချက်ဥပမာ
သံကွင်းဆက်: https://www.example.com
သံကွင်းဆက်: https://www.example.com
သံကွင်းဆက်: https://www.example.com

သင်မြင်နိုင်သည့်အတိုင်း, Dom Objects ၏သက်ဆိုင်ရာနည်းလမ်းများအသုံးပြုခြင်းအားဖြင့်ကျွန်ုပ်တို့သည် HTML document ကိုအောင်မြင်စွာခွဲခြမ်းစိတ်ဖြာပြီးခေါင်းစဉ်အားလုံးကိုထုတ်ယူသည်။

နိဂုံးချုပ်အားဖြင့်

PHP ၏ dom extension မှတဆင့် HTML / XML စာရွက်စာတမ်းများကိုအလွယ်တကူခွဲခြမ်းစိတ်ဖြာနိုင်ပြီး Node ကိုဖြတ်သန်းခြင်း, DOM ၏လွတ်လပ်မှုသည်ဖွံ့ဖြိုးတိုးတက်မှုပတ် 0 န်းကျင်အမျိုးမျိုးအတွက်သင့်တော်သည်။

အမှန်တကယ်ဖွံ့ဖြိုးတိုးတက်မှုတွင် Dom ကို XPath ကဲ့သို့သောအခြားနည်းပညာများနှင့် တွဲဖက်. အခြားနည်းပညာများဖြင့်ပိုမိုရှုပ်ထွေးသော HTML / XML အဆောက်အအုံများကိုကိုင်တွယ်နိုင်သည်။ ဤသင်ခန်းစာသည် PHP ရှိစာရွက်စာတမ်းများကိုခွဲခြမ်းစိတ်ဖြာရန် dom ကို အသုံးပြု. သင်၏စီမံကိန်းတွင်ပြောင်းလွယ်ပြင်လွယ်သုံးနိုင်သည်ဟုသင်မျှော်လင့်ပါသည်။

ဤသင်ခန်းစာသည် dom parsing ၏အခြေခံလုပ်ဆောင်ချက်များကိုသာပြသသည်။ လက်တွေ့ကျသော application များမှာပိုမိုရှုပ်ထွေးသော HTML / XML Document ဖွဲ့စည်းပုံများနှင့်သက်ဆိုင်သည်။

  • သက်ဆိုင်သောတက်(ဂ်)များ:

    HTML
မကြာသေးမီ ဆောင်းပါးများ