Kako indeksirati veliku web lokaciju i izvući podatke pomoću vrištećeg žabljeg SEO Spider-a

Vrištanje žaba SEO Spider

Trenutno pomažemo nekoliko klijenata Marketo migracije. Kako velike kompanije koriste ovakva poslovna rješenja, to je poput paukove mreže koja se godinama utka u procese i platforme ... sve dotle da kompanije nisu svjesne svake dodirne točke.

Uz platformu za automatizaciju marketinškog preduzeća poput Marketo, obrasci su početna točka podataka na web lokacijama i odredišnim stranicama. Kompanije na svojim web lokacijama često imaju hiljade stranica i stotine obrazaca koje treba identificirati za ažuriranje.

Odličan alat za to je Vrišteći žablji SEO Spider... možda najpopularnija platforma na tržištu za indeksiranje, reviziju i izdvajanje podataka sa web lokacije. Platforma je bogata značajkama i nudi stotine opcija za gotovo svaki zadatak koji vam je potreban.

Vrišteći žaba SEO Spider: puzanje i ekstrakt

Ključna karakteristika Screaming Frog SEO Spider je da možete izvoditi prilagođena izvlačenja na osnovu Regex, XPath, ili CSSPath specifičnosti. Ovo je izuzetno korisno jer želimo indeksirati klijentove web lokacije i revidirati i zabilježiti vrijednosti MunchkinID i FormId sa stranica.

Otvorite alat Konfiguracija> Prilagođeno> Izdvajanje da prepoznate elemente koje želite izvući.

screamingfrog prilagođeno vađenje

Ekran za izdvajanje omogućava praktično neograničeno prikupljanje podataka:

Pravila o ekstrakciji pauka koja kriče od žabe

Ekstrakcija regularnih izraza, XPath i CSSPath

Za MunchkinID, identifikator se nalazi unutar skripte obrasca koja se nalazi na stranici:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Zatim primjenjujemo a Regex pravilo za hvatanje ID-a unutar oznake skripte koja je umetnuta na stranicu:

Regex: ["']id["']: *["'](.*?)["']

Za ID obrasca, podaci su u ulaznoj oznaci unutar obrasca Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Primjenjujemo XPath pravilo za hvatanje ID-a iz obrasca koji je umetnut na stranicu. Upit XPath traži obrazac s ulazom s imenom formid, zatim ekstrakcija sprema vrijednost:

XPath: //form/input[@name="formid"]/@value

Vriskanje žabe SEO Spider Javascript prikazivanje

Još jedna izvrsna opcija Screaming Frog je da niste ograničeni na HTML na stranici, možete prikazati bilo koji JavaScript koji će umetnuti obrasce na vašu web lokaciju. Unutar Konfiguracija> Pauk, možete otići na karticu Prikazivanje i omogućiti ovo.

Vriskanje žabe SEO Spider Javascript prikazivanje

Za to je potrebno malo više vremena za indeksiranje stranice, ali dobit ćete obrasce koje JavaScript prikazuje na strani klijenta, kao i obrasce koji su umetnuti na strani poslužitelja.

Iako je ovo vrlo specifična aplikacija, nevjerovatno je korisna dok radite s velikim web lokacijama. Apsolutno ćete htjeti provjeriti gdje su obrasci ugrađeni u cijelu web lokaciju.

Preuzmite Screaming Frog SEO Spider

Šta ti misliš?

Ova stranica koristi Akismet kako bi smanjila neželjenu poštu. Saznajte kako se podaci vašeg komentara obrađuju.