Ce este un sitemap XML și cum poți crea unul pentru SEO (cu exemple)

Publicat: 2022-01-25

XML Sitemap Small Sitemap-urile XML sunt una dintre cele mai greșite elemente ale ecuației SEO.

Am întâlnit SEO care nu au putut explica de ce sunt necesare, cu atât mai puțin să vă spun cum să configurați unul „corect”.

Iată problema:

Așa cum o hartă este esențială pentru a vă găsi destinația pe drum, o hartă XML a site-ului este esențială pentru motoarele de căutare pentru a localiza adresele URL ale site-ului dvs. web.

Fără ca adresele URL să fie accesate cu crawlere, acestea nu vor fi indexate, iar paginile dvs. nu se vor clasa (desigur) fără indexare.

Pe scurt, sitemap-urile XML joacă un rol crucial în optimizarea motoarelor de căutare.

În postarea de astăzi, vă voi arăta cum să creați un sitemap XML de la zero și să îl optimizați perfect pentru SEO, pas cu pas. acopăr:

  • Ce este un sitemap XML
  • Sitemap-uri XML vs. HTML
  • Etichete XML sitemap (și pe care ar trebui să le utilizați)
  • Exemple de hărți de site XML
  • De ce aveți nevoie de un sitemap XML
  • Cum se creează un sitemap XML
  • Șase bune practici pentru crearea sitemap.xml

Fără alte prelungiri, hai să intrăm.

Ce este un Sitemap XML? (Și de ce naiba ar trebui să îți pese)

In termeni simpli:

Un sitemap XML este o foaie de parcurs pentru motoarele de căutare.

Listează conținutul important al site-ului dvs. în format XML, astfel încât motoarele de căutare să vă poată găsi și indexa cu ușurință conținutul și, în cele din urmă, să-l afișeze în paginile cu rezultate ale motorului de căutare.

Ce este un sitemap XML

Ar trebui să enumerați în harta site-ului dvs. XML orice pagină web (sau fișier) pe care doriți să o afișați în motoarele de căutare.

De ce?

Pentru că o hartă a site-ului asigură că conținutul tău este descoperit.

Să presupunem că aveți pagini web care nu sunt legate de niciun punct de pe site-ul dvs. sau de pe web în general. Dacă paginile respective nu au hyperlinkuri care să indice către ele, acestea nu vor fi găsite de crawlerele web.

O hartă a site-ului XML (trimisă motoarele de căutare) asigură că motoarele de căutare pot găsi orice pagini pe care doriți să fie incluse în SERP-uri.

Dar asta nu este tot.

Puteți folosi un sitemap XML pentru a furniza informații suplimentare motoarelor de căutare, cum ar fi când conținutul dvs. a fost actualizat ultima dată și care pagini au prioritate mai mare. Mai multe despre asta mai târziu.

Sitemap-uri XML vs. HTML – Care este diferența?

Puteți adăuga două tipuri de hartă site pe site-ul dvs.; un sitemap XML și un sitemap HTML.

  • Sitemap-urile XML folosesc limbajul de marcare extensibil (XML)
  • Hărțile de site HTML utilizează limbajul de marcare hipertext (HTML)
Harta site-ului XML vs HTML

Dar, în afară de codul pe care îl folosesc, ele servesc și diferite funcții:

Harta site XML

Să începem cu un exemplu de hartă de site XML:

Exemplu de hartă de site XML

După cum puteți vedea, sitemap-urile XML nu sunt prietenoase cu oamenii.

Sitemap-urile XML sunt fluxuri concepute în mod explicit pentru motoarele de căutare.

Ele ajută motoarele de căutare precum Google să înțeleagă ce adrese URL să acceseze cu crawlere și ce are prioritate.

În plus, cât de des se schimbă acele adrese URL și care dintre noi au fost adăugate pe site.

Frecvența de accesare cu crawlere a sitemapului XML

Aceste informații îi ajută pe programatorii motoarelor de căutare să evalueze mai bine când și cât de des să acceseze din nou cu crawlere o anumită adresă URL.

Harta site-ului HTML

Iată un exemplu de hartă de site HTML:

Exemplu de hartă de site HTML

Arată foarte diferit de un sitemap XML.

Asta pentru că este o pagină web concepută atât pentru oameni, cât și pentru roboți.

Pentru oameni, o hartă HTML a site-ului ajută la o mai bună navigare printr-un site web.

Din perspectiva unui motor de căutare, un sitemap HTML este un instrument util pentru descoperirea URL-ului (presupunând că harta site-ului este accesată cu crawlere și că sunt urmate linkurile conținute în harta site-ului).

Dar, aceasta nu este singura lor valoare pentru SEO:

Hărțile de site HTML distribuie, de asemenea, PageRank pe un site web.

Deoarece hărțile de site HTML sunt legate în mod obișnuit de la fiecare pagină de pe un site (prin intermediul unui link de navigare din subsol), acestea au o mulțime de PageRank.

Subsolul site-ului

Aceasta înseamnă că ei pot transmite o încărcătură a PageRank-ului lor primit către alte pagini de pe site prin link-uri interne.

Aveți o pagină care are un clasament slab?

Adăugați pagina respectivă pe harta dvs. HTML.

Poate fi o modalitate rapidă și ușoară de a-i oferi un impuls în clasament.

Cum arată un Sitemap XML?

După cum am subliniat deja, sitemap-urile XML sunt pentru motoarele de căutare, nu pentru oameni.

Cu siguranță pot părea confuz dacă nu ați mai întâlnit niciodată unul înainte:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>

Cu toate acestea, când știți ce înseamnă fiecare dintre aceste componente:

  • Declarație XML
  • Adresa URL a fost setată
  • URL
  • Modificat ultima dată
  • Prioritate
  • schimba frecventa

Sitemap-urile XML sunt destul de simple.

Să le defalcăm pe fiecare:

Declarație XML

În termeni simpli, declarația XML le spune motoarele de căutare că citesc un fișier XML.

 <?xml version="1.0" encoding="UTF-8"?>

Declarația XML precizează, de asemenea, versiunea XML și codificarea caracterelor utilizate.

  • Versiunea ar trebui să fie 1.0
  • Codificarea trebuie să fie UTF-8.

Plasați declarația XML în partea de sus a fișierului sitemap.xml.

Setare URL

Setul de adrese URL este un container pentru toate adresele URL din harta site-ului.

Începe prin a preciza ce standard de protocol folosește sitemap.xml:

 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Veți observa că protocolul menționat în exemplul de mai sus este standardul 0.9.

Google, Yahoo și Microsoft acceptă acest standard de hărți de site – este cel pe care vi-l recomand să îl utilizați.

Este important să rețineți că setul de adrese URL se închide în partea de jos a documentului XML:

 </urlset>

Acest scurt fragment de cod le spune motoarele de căutare că setul de adrese URL s-a încheiat.

URL

Eticheta <URL> este eticheta părinte pentru fiecare adresă URL din harta site-ului XML:

 <url> <loc>https://seosherpa.com/services/</loc> </url> <url> <loc>https://seosherpa.com/services/</loc> </url>

Între <url> de deschidere și de închidere </url>, trebuie să precizați locația adresei URL într-o etichetă <loc> imbricată.

Ceea ce este esențial aici este că specificați adresa URL absolută, inclusiv protocolul său HTTP:// sau HTTPS://.

Cu alte cuvinte, enumerați adresa URL exact așa cum ar apărea într-un browser web.

URL în browser

Pe de altă parte, adresele URL relative precum /services/ nu vor fi recunoscute.

Locația URL este singurul atribut care TREBUIE menționat între etichetele URL.

Dar cu acestea spuse, există alte trei proprietăți (opționale) care pot fi incluse:

Modificat ultima dată

Eticheta <lastmod> determină când a fost modificat ultima dată conținutul acelui URL.

 <lastmod>2022-01-26T19:12:36+09:00</lastmod>

Să presupunem că ați actualizat o postare pe blog pe 10 ianuarie 2022; atributul <lastmod> ar citi 2022-01-10.

Le spune motoarelor de căutare când a fost revizuit ultima dată conținutul acelui URL, ceea ce, teoretic , influențează momentul în care un motor de căutare accesează pagina respectivă.

Puteți preciza și ora, dar nu este necesar.

Indiferent dacă includeți doar data sau ora, asigurați-vă că utilizați formatul „W3C datetime”.

Este singurul format care este recunoscut pentru eticheta <lastmod> într-un sitemap.xml.

Prioritate

Eticheta <priority> specifică prioritatea adresei URL în raport cu toate celelalte adrese URL de pe site.

 <priority>0.8</priority>

Cu alte cuvinte, vă permite să spuneți motoarelor de căutare care adrese URL ar trebui să aibă prioritate atunci când alocă bugetul de accesare cu crawlere site-ului dvs.

Valorile prioritare pot fi setate de la 0,0, care este cea mai mică prioritate, până la 1,0, care este cea mai mare.

Problema este că Google ignoră <prioritate> în hărțile de site XML, deoarece în cuvintele lui Gary Illyes „este un sac de zgomot”.

Deci, chiar nu are rost să stabilim priorități.

Schimba frecventa

Întrucât, eticheta <lastmod> determină când a fost modificat ultima dată conținutul acelui URL...

Eticheta <changfreq> indică cât de des este probabil să se schimbe conținutul.

 <changefreq>Daily</changefreq>

Scopul său este de a oferi motoarelor de căutare o idee despre cât de des ar putea dori să acceseze din nou URL-ul.

Frecvența modificărilor într-un sitemap XML poate fi setată la oricare dintre următoarele valori:

  • mereu
  • orar
  • zilnic
  • săptămânal
  • lunar
  • anual
  • nu

Dacă eticheta a fost setată la <changefreq>Săptămânal</changefreq> un motor de căutare poate dori să acceseze din nou acea adresă URL la fiecare șapte zile.

A face acest lucru mai des de atât ar fi o risipă, deoarece conținutul este puțin probabil să varieze.

Cu toate acestea, <changefreq> este învechit în ceea ce privește Google:

Deoarece majoritatea generatorilor de hărți de site fac o treabă groaznică de a potrivi eticheta <changefreq> cu frecvența reală a modificării, este ușor de înțeles de ce.

Puteți omite atributul frecvență de modificare din sitemap.xml.

Exemple de sitemap XML

Acum că știm ce face un sitemap XML, să aruncăm o privire la câteva exemple sitemap.xml așa cum apar în lumea reală.

Iată harta site-ului XML pentru paginile Gymshark:

Acest sitemap ar putea fi îmbunătățit prin eliminarea <changefreq>, deoarece este ignorat de Google și prin adăugarea unei declarații XML la începutul sitemapului XML.

(Includerea unei declarații XML este cea mai bună practică pentru toate sitemapurile).

Iată un alt exemplu de hartă de site XML, de data aceasta de la yasisland.ae

Exemplu de hartă de site XML

Ca și harta site-ului Gym Shark, această hartă a site-ului poate fi îmbunătățită prin adăugarea declarației XML la început.

În plus, modificarea frecvenței și priorității pot fi eliminate, deoarece acestea sunt redundante în prezent.

În afară de asta, aceste sitemap-uri XML sunt configurate corect.

Deci, în această etapă, probabil că vă întrebați:

Cum arată sitemap-ul optim XML?

Ceva de genul:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>

Ar trebui să conțină:

  • Declarație XML (versiune)
  • Adresa URL a fost setată
  • URL(e)
  • Ultima modificare (numai pentru data)
Exemplu de hartă de site XML

Și asta e cu adevărat tot.

De ce am nevoie de un Sitemap XML?

După cum am explicat mai devreme, un motor de căutare descoperă conținut pe web prin accesarea cu crawlere de la o pagină web la alta folosind roboți denumiți adesea „păianjeni”:

Motorul de căutare Spider Crawling

Când acești păianjeni descoperă o pagină nouă printr-un link intern sau extern, ei adaugă pagina respectivă la indexul lor.

Dar problema cu crawling-ul?

Motoarele de căutare nu pot găsi tot conținutul de pe web în acest fel.

Dacă o pagină web nu este conectată printr-o altă pagină cunoscută, un motor de căutare nu o va găsi.

Aici intervine un sitemap XML.

Sitemap-urile XML acționează ca asigurare pentru accesarea cu crawlere, informând motoarele de căutare unde să găsească cele mai importante pagini de pe site-ul dvs., astfel încât să ajute la descoperirea și indexarea conținutului.

Acest lucru este esențial, deoarece motoarele de căutare nu pot clasifica conținutul dvs. fără să îl indexeze mai întâi.

Ce tip de site-uri web au nevoie de un Sitemap XML?

Dacă urmați sfaturile Google, hărțile de site XML sunt cele mai bune pentru:

  • Site-uri web mari cu mii de pagini
  • Site-uri web cu arhive extinse
  • Site-uri web cu mult conținut media bogat
  • Site-uri web fără backlink sau foarte puține

Dar iată chestia:

Toate site-urile web beneficiază de a avea un sitemap XML.

Când includeți o hartă XML a site-ului, roboții motoarelor de căutare pot înțelege mai bine structura site-ului dvs., vă pot descoperi conținutul și pot afla când a fost actualizat ultima dată.

Chiar dacă aveți un site web cu o singură pagină, inclusiv un sitemap XML merită probabil.

Ce pagini ar trebui să includeți în sitemap-ul dvs. XML?

Răspunsul scurt:

Includeți orice pagini pe care doriți să le afișați în rezultatele căutării în harta site-ului dvs. XML și lăsați totul afară.

Cu alte cuvinte, harta dvs. de site ar trebui să includă numai pagini care au utilitate. Lucruri ca:

  • Pagina principala
  • Despre pagina
  • Pagini de produse
  • Pagini de service
  • Pagina de contact
  • Postări pe blog

În general, nu ați include pagini precum:

  • Va multumesc pagini
  • Etichetați paginile
  • Fișiere media private

Acestea sunt toate exemple de adrese URL pe care nu ați dori să apară în rezultatele căutării.

Incluziuni XML Sitemap

Dar rețineți, doar pentru că omiteți o pagină de pe harta site-ului dvs. nu înseamnă că nu va fi indexată.

Dacă pagina are linkuri care indică către ea, există șansa ca Google (și alte motoare de căutare) să acceseze cu crawlere, să indexeze și să afișeze pagina respectivă în rezultatele motorului de căutare.

Pentru a asigura eliminarea unei pagini din rezultatele căutării, omiteți pagina din harta site-ului dvs. XML și adăugați o etichetă fără index.

Și asta mă duce la următorul punct:

Fiecare pagină din harta dvs. XML de site trebuie să fie indexabilă.

Sitemap-ul dvs. nu trebuie să conțină niciodată pagini care returnează aceste coduri de stare:

  • 404 Pagina nu a fost găsită
  • 301 sau 302 – Pagina mutată în altă locație

Codurile de stare 4XX și 3XX spun motoarelor de căutare că nu există nicio pagină acolo.

Și, dacă nu există nicio pagină pe acea adresă URL, aceasta nu poate fi indexată.

În plus:

Fiecare pagină trebuie să fie accesibilă crawlerilor motoarelor de căutare.

Pe scurt, robots.txt nu blochează pagina și nu există directive (cum ar fi meta-roboți, link-uri canonice sau x-robots-tags) care să spună motoarelor de căutare să nu indexeze pagina.

Acum că știți ce este inclus într-un sitemap XML, haideți să discutăm cum creați unul.

Cum se creează un Sitemap XML (2 metodologii)

Dacă ți-ai construit site-ul web folosind un sistem de gestionare a conținutului precum Shopify sau Wix, atunci nu trebuie să creezi un sitemap XML, deoarece CMS-ul tău va genera un sitemap pentru tine.

Harta site-ului XML de pe aceste platforme (și altele asemenea) este actualizată automat când paginile sunt adăugate – sau eliminate – de pe site.

Dacă CMS-ul tău nu face acest lucru, atunci există de obicei un plugin care o va face pentru tine.

Pe de altă parte, dacă nu utilizați un CMS, atunci va trebui să creați manual un sitemap XML.

Să descompunem procesul:

Cum se creează manual un Sitemap XML

Dacă sunteți îngrijorat că va trebui să codificați manual sitemap-ul XML, nu vă faceți griji!

Acest proces nu este chiar manual.

Vom folosi Screaming Frog pentru a face cea mai mare parte a muncii pentru tine.

Primul pas este să instalați Screaming Frog SEO Spider.

Sfat – puteți folosi versiunea gratuită dacă site-ul dvs. are mai puțin de trei sute de pagini.

Odată instalat, navigați la „Mod”, apoi la „Spider”.

Apoi, plasați adresa URL a paginii de pornire în caseta marcată „Introduceți adresa URL pentru spider”.

Apoi, apăsați „Start”.

Screaming Frog va începe apoi să acceseze cu crawlere site-ul dvs.

Odată ce accesarea cu crawlere s-a încheiat, în continuare ajustăm câteva setări:

Screaming Frog Setări Sitemap

Deoarece Google nu folosește <changefreq> și <priority>, recomand să excludeți acele etichete din fișierul sitemap.

De asemenea, vă sugerez să omiteți <lastmod> din harta dvs. de site XML dacă creați manual un hartă de site XML.

De ce?

Pentru că este o adevărată durere să reconstruiești harta site-ului XML de fiecare dată când faci modificări minore unei pagini.

Excluderea <lastmod> din harta dvs. XML de site va însemna că nu trebuie.

Înainte de a extrage fișierul sitemap, puteți adăuga, edita sau șterge adrese URL în funcție de ceea ce doriți ca motoarele de căutare să acceseze cu crawlere și să indexeze.

După ce ați terminat de ajustat harta site-ului, o puteți încărca în folderul rădăcină al site-ului dvs., cu „sitemap.xml” ca nume de fișier.

Destul de simplu, nu?

Cum se creează un Sitemap XML în WordPress

Ar putea fi o surpriză, dar o instalare WordPress „out-of-the-box” nu vine cu un creator de hărți de site XML.

Pentru a genera un sitemap XML în WordPress, veți avea nevoie de un plugin, cum ar fi Yoast SEO.

Iată cum să adăugați Yoast pe site-ul dvs., dacă nu îl aveți deja instalat:

În tabloul de bord WordPress, accesați „Plugin-uri” și apoi „Adăugați nou”.

Apoi, căutați „Yoast SEO”.

Pluginul Yoast SEO

Apoi faceți clic pe „Instalați acum” pe primul rezultat, apoi pe „Activați”.

Odată ce Yoast este instalat, navigați la setările Yoast și selectați „SEO”, apoi „XML Sitemaps” și apoi „General”.

În această filă, asigurați-vă că „Funcționalitatea sitemap XML este setată la „activată”.

Cu sitemap-urile XML activate, ar trebui să vedeți acum indexul sitemap-ului dvs. la yourdomain.com/sitemap_index.xml.

Indexul sitemapului Yoast

Din fericire, Yoast exclude automat paginile care nu pot fi indexate (de exemplu, cele cu meta-etichetă „fără indexare”) de la includerea în harta site-ului. Așa fiind, configurația standard ar trebui să fie bună în majoritatea cazurilor.

Dacă doriți, totuși, puteți alege să excludeți anumite tipuri de postări și taxonomii pentru a vă optimiza în continuare sitemap:

Harta site-ului Yoast XML configurată

Pentru site-ul SEO Sherpa, am exclus media și etichetele din harta site-ului meu, pentru că cel puțin în cazul meu, aceste pagini au o valoare mică pentru utilizatorii finali.

Cum se creează un Sitemap XML în Wix

Spre deosebire de WordPress, Wix are încorporată funcționalitate XML sitemap.

Problema este că este destul de limitat.

Singura opțiune pe care o aveți este să excludeți anumite pagini.

Dacă doriți să excludeți o pagină, mergeți la fila de setări „SEO (Google)” a paginii și dezactivați comutatorul „Afișați această pagină în rezultatele căutării”.

Setările motorului de căutare Wix

Aceasta adaugă o etichetă meta noindex la pagină ȘI o exclude din harta site-ului XML.

O provocare cu funcționalitatea rigidă a sitemap-ului Wix este că include adrese URL care au fost canonizate pe o altă pagină.

Acest lucru spune în esență „clasați această pagină” și „nu clasați această pagină” în același timp, ceea ce este foarte confuz pentru motoarele de căutare.

Rezultatul ar putea fi versiunea greșită care apare pe paginile cu rezultatele căutării.

Dacă aveți un site web Wix, puteți găsi harta site-ului generată automat la yourdomain.com/sitemap.xml.

Cum se creează un Sitemap XML în Shopify

Nu trebuie să creați un sitemap XML dacă site-ul dvs. este construit cu Shopify, este făcut automat pentru dvs.

Din păcate, totuși, nu există nicio personalizare posibilă.

Cu Shopify, nici măcar nu puteți exclude o pagină din harta site-ului dvs. XML - totul este inclus.

Singura modalitate de a controla ceea ce apare în rezultatele căutării este să adăugați direct o etichetă noindex la fișierele .liquid.

Totuși, în Shopify paginile fără indexare se vor afișa în XML sitemap, ceea ce, așa cum am subliniat mai devreme, nu este ideal.

Găsiți harta site-ului dvs. la yourdomain.com/sitemap.xml.

Cum să trimiteți sitemap-ul dvs. la Google

Până acum, ar trebui să aveți sitemap creat.

Ultimul (și posibil cel mai important) pas este să trimiteți sitemap-ul dvs. la Google.

Desigur, înainte de a face asta, trebuie să știți unde se află harta site-ului dvs.

Dacă v-ați creat sitemap-ul manual sau utilizați Wix sau Shopify, atunci sitemap-ul dvs. poate fi găsit la următoarea adresă URL:

domeniul dvs..com/sitemap.xml

Pe de altă parte, dacă site-ul dvs. este pe WordPress și ați folosit Yoast pentru sitemap.xml, atunci veți găsi indexul sitemap-ului la această adresă URL:

yourdomain.com/sitemap_index.xml

Dacă utilizați o altă platformă – sau nu vă puteți găsi harta site-ului în oricare dintre aceste locații, puteți verifica harta site-ului dvs. folosind instrumentul nostru de evaluare SEO:

Grader SEO

Odată ce știți unde se află harta dvs. XML de site, accesați Google Search Console, apoi „Sitemaps”, pe care le veți găsi în meniul „Index”.

Apoi, inserați adresa URL a sitemap-ului dvs. în câmpul sitemap-ului și apăsați „Trimiteți”.

Sitemap-ul dvs. „ar trebui” să fie trimis cu succes:

Google Search Console Trimite sitemap succes

Și, cu asta, ai terminat!

7 Cele mai bune practici XML „esențiale” pentru harta site-ului

Să încheiem cu un șir de bune practici XML sitemap.

Veți dori să executați aceste tehnici pentru a vă asigura că sitemap-ul dvs. XML este optimizat pentru accesarea cu crawlere și indexare eficientă.

Să sărim înăuntru.

(1). Utilizați un Sitemap dinamic NU un Sitemap static

Imaginați-vă că trebuie să vă actualizați manual harta site-ului XML ori de câte ori faceți modificări site-ului dvs.?!

Ei bine, exact asta ai avea de făcut cu un sitemap static.

Din fericire, majoritatea CMS-urilor moderne au încorporată funcționalitate de hartă de site XML dinamică – sau disponibilă printr-un plugin.

Care înseamnă:

Harta site-ului dvs. se va actualiza automat ori de câte ori adăugați, modificați sau eliminați pagini existente.

Nu este nevoie de intervenție manuală.

Utilizarea unei hărți dinamice a site-ului este deosebit de importantă pentru site-urile web mari unde paginile prioritare sunt adăugate frecvent.

Asigurați-vă că utilizați unul.

(2). Folosiți locația și numele sitemapului standard

Dacă ar fi să utilizați /my_website_sitemap.xml ca cale pentru sitemap-ul dvs. XML, există șansa ca motoarele de căutare să nu îl găsească.

Pentru a vă asigura că sitemap-ul dvs. este ușor de descoperit, respectați locațiile standard:

https://yourdomain.com/sitemap.xml pentru sitemapurile individuale

SAU

https://yourdomain.com/sitemap_index.xml atunci când aveți mai multe sitemap-uri într-un index.

Este atat de simplu.

(3). Faceți referire la sitemap-ul dvs. XML în fișierul dvs. Robots.txt

Fișierul dvs. robots.txt este vizitat de roboții motoarelor de căutare atunci când încep accesarea cu crawlere a site-ului dvs.

Ei folosesc robots.txt pentru a înțelege cum să acceseze cu crawlere site-ul.

Făcând referire la harta site-ului dvs. XML în fișierul robots.txt, vă asigurați că roboții de căutare o pot găsi.

Pentru a adăuga sitemap-ul dvs. XML la robots.txt, deschideți fișierul text robots și inserați această linie în el:

 Sitemap: https://www.yourdomain.com/sitemap.xml

Puteți găsi fișierul robots.txt în directorul rădăcină al serverului dvs. pe calea „/robots.txt”.

Dacă aveți mai multe sitemap-uri XML, enumerați-le unul câte unul, astfel:

 Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml

În timp ce, teoretic, puteți plasa locația sitemap-ului oriunde în robots.txt, în general, este cel mai bine plasată la sfârșit:

Referință pentru harta site-ului Robots txt

(4). Excludeți paginile Noindex din Harta dvs. de site

Rolul unui sitemap XML este de a spune motoarelor de căutare ce să acceseze cu crawlere – și să indexeze.

Aceasta înseamnă că ar trebui incluse doar paginile preferate care merită clasament.

Adăugarea de pagini Noindex, non-canonice sau de redirecționare pe harta site-ului dvs. va deruta motoarele de căutare și ar putea afecta negativ bugetul de accesare cu crawlere.

(5). Păstrați sitemap-ul dvs. XML sub 50 MB

Potrivit Google, un sitemap XML nu trebuie să depășească 50 MB sau 50.000 de adrese URL.

Limită de dimensiune a fișierelor pentru Harta site-ului

Ori de câte ori depășiți limita de 50 MB sau 50.000 de adrese URL, ar trebui să împărțiți un singur Sitemap XML în mai multe fișiere XML Sitemap.

Depășirea acestor limite poate duce la oprirea accesării cu crawlere a Google.

De exemplu, puteți împărți harta site-ului în „postări” și „pagini”.

Apoi grupați-le într-un fișier Sitemap Index.

(6). Ignorați atributele Priority și Changefreq

După cum am subliniat mai devreme, Google trece cu vederea ambele etichete:

  • <changefreq>
  • <prioritate>

Aceasta înseamnă că, inclusiv frecvența modificării și atributele Prioritate, se adaugă doar pondere inutilă în harta site-ului, ceea ce poate duce la probleme legate de bugetul de accesare cu crawlere și de indexare.

Vă recomand să nu utilizați etichetele <changefreq> sau <priority> în harta site-ului dvs.

(7). Monitorizați Google Search Console pentru erori XML Sitemap

Dacă Google nu poate accesa cu crawlere harta dvs. XML de site, vă va spune prin Search Console:

Erori GSC Sitemap

Erorile pot fi la fel de simple ca URL-ul sitemap XML care nu poate fi preluat, la adresele URL trimise care returnează coduri de stare 404 sau fără index.

Cele mai frecvente probleme tind să fie:

(A). Adresa URL trimisă nu a fost găsită (404)

Aceasta înseamnă că o adresă URL pe care ați trimis-o în harta dvs. XML de site nu există.

Nu uitați, dacă eliminați o pagină de pe site-ul dvs. web, nu uitați să o eliminați de pe harta site-ului. Mai bine, utilizați un sitemap XML dinamic și adresa URL va fi eliminată automat de pe harta dvs. de site.

(b). Adresa URL trimisă marcată „noindex”

Acest lucru se întâmplă atunci când o pagină din harta dvs. XML de site are o metaetichetă „noindex”.

Dacă doriți ca această pagină să fie indexată, trebuie să eliminați eticheta meta „noindex”. Dacă nu doriți să fie indexat, eliminați-l din harta site-ului dvs.

Oricum ar fi, trebuie reparat.

(c). Adresa URL trimisă a fost blocată de robots.txt

Acest lucru se întâmplă atunci când o pagină conținută în harta dvs. XML de site este blocată de robots.txt.

Practic, în fișierul dvs. robots.txt există o directivă care le spune motoarelor de căutare să nu acceseze pagina cu crawlere, chiar dacă le-ați cerut motoarelor de căutare să facă exact asta, trimițând-o pentru a fi indexată.

Dacă doriți să fie indexată adresa URL, găsiți și eliminați directiva din fișierul robots.txt.

Instrument de testare Robots TXT

Încercați să vă testați pagina folosind testerul robots.txt pentru a descoperi vinovatul.

Și iată-l; șapte cele mai bune practici XML sitemap.

Tu ce crezi?

Acum aș dori să aud de la tine:

Ce tehnică din postarea de azi vei folosi mai întâi?

Ce modificări ai de gând să faci sitemap-ului tău XML ca urmare a citirii postării de astăzi?

Poate că veți trece de la un manual la un sitemap XML automat? Sau, poate veți omite eticheta <changefreq>?

Oricum, anunță-mă lăsând un comentariu mai jos.