PHP get URL from HTML: Estrarre i links di una pagina html con l’oggetto DOM di PHP5

Pubblicato il 2 Dicembre 2011

Se abbiamo necessità, nella nostra applicazione web, di estrarre tutti i link presenti in una pagina web, una soluzione comoda è quella di utilizzare l’oggetto DOM di PHP5.

Vediamo come realizzare una semplice funzione che, tramite la classe DOMDocument, restituisce gli attributi href e text sottoforma di array multidimensionale:

function getUrlFromHTML($url) {

    $xml = new DOMDocument();

    @$xml->loadHTMLFile($url);

    $links = array();

    foreach($xml->getElementsByTagName('a') as $link) {
        $links[] = array('url' => $link->getAttribute('href'), 'text' => $link->nodeValue);
    }

    return $links;
}

$arr = getUrlFromHTML("https://www.emawebdesign.com");

Servendoci di un ciclo FOR, ecco come possiamo visualizzare il contenuto dell’array:

for ($i=0;$i";
echo $arr[$i]["text"] ."
"; }

Semplice e comodo 😉

Condividi il post con i tuoi amici o colleghi
emawebdesign
Autore: emawebdesign

Full Stack Developer, SEO Specialist, esperto della trasformazione digitale con oltre 20 anni di esperienza.

Pubblicato in: