Che cos'è una Sitemap XML e come crearne una per la SEO (con esempi)

Pubblicato: 2022-01-25

Mappa del sito XML Piccola Le mappe dei siti XML sono uno dei pezzi più errati dell'equazione SEO.

Mi sono imbattuto in SEO che non sono stati in grado di spiegare perché sono necessari, per non parlare di come impostarne uno "giusto".

Ecco il problema:

Proprio come una mappa è essenziale per trovare la tua destinazione su strada, una mappa del sito XML è fondamentale per i motori di ricerca per individuare gli URL del tuo sito web.

Senza che i tuoi URL vengano scansionati, non verranno indicizzati e le tue pagine non si classificheranno (ovviamente) senza l'indicizzazione.

In breve, le mappe dei siti XML svolgono un ruolo cruciale nell'ottimizzazione dei motori di ricerca.

Nel post di oggi, ti mostrerò come creare una mappa del sito XML da zero e ottimizzarla perfettamente per la SEO, passo dopo passo. Sto coprendo:

  • Che cos'è una mappa del sito XML
  • Mappe del sito XML e HTML
  • Tag XML della mappa del sito (e quali dovresti usare)
  • Esempi di mappe del sito XML
  • Perché hai bisogno di una mappa del sito XML
  • Come creare una mappa del sito XML
  • Sei best practice per la creazione di sitemap.xml

Senza ulteriori indugi, entriamo.

Che cos'è una Sitemap XML? (E perché diavolo dovrebbe interessarti)

In parole povere:

Una mappa del sito XML è una tabella di marcia per i motori di ricerca.

Elenca i contenuti importanti del tuo sito Web in formato XML, in modo che i motori di ricerca possano trovare e indicizzare facilmente i tuoi contenuti e, infine, visualizzarli nelle pagine dei risultati dei motori di ricerca.

Che cos'è una mappa del sito XML

Dovresti elencare nella tua mappa del sito XML qualsiasi pagina web (o file) che desideri visualizzare nei motori di ricerca.

Come mai?

Perché una mappa del sito garantisce che i tuoi contenuti siano rilevabili.

Diciamo che hai pagine web che non sono collegate da nessuna parte del tuo sito o del web in generale. Se quelle pagine non hanno collegamenti ipertestuali che puntano ad esse, non saranno rilevabili dai crawler web.

Una mappa del sito XML (inviata ai motori di ricerca) assicura che i motori di ricerca possano trovare tutte le pagine che desideri siano incluse nelle SERP.

Ma non è tutto.

Puoi utilizzare una mappa del sito XML per fornire informazioni aggiuntive ai motori di ricerca, ad esempio quando il tuo contenuto è stato aggiornato l'ultima volta e quali pagine hanno la priorità più alta. Ne parleremo più avanti.

Sitemap XML e HTML: qual è la differenza?

Puoi aggiungere due tipi di mappa del sito al tuo sito; una mappa del sito XML e una mappa del sito HTML.

  • Le mappe del sito XML utilizzano il linguaggio di markup estensibile (XML)
  • Le mappe del sito HTML utilizzano il linguaggio di markup ipertestuale (HTML)
Mappa del sito XML vs HTML

Ma a parte il codice che usano, servono anche diverse funzioni:

Mappa del sito XML

Iniziamo con un esempio di Sitemap XML:

Esempio di mappa del sito XML

Come puoi vedere, le mappe dei siti XML non sono compatibili con l'uomo.

Le Sitemap XML sono feed progettati esplicitamente per i motori di ricerca.

Aiutano i motori di ricerca come Google a comprendere quali URL scansionare e quali sono le priorità.

Inoltre, quanto spesso cambiano quegli URL e quali nuovi sono stati aggiunti al sito.

Frequenza di scansione della mappa del sito XML

Queste informazioni aiutano i pianificatori dei motori di ricerca a valutare meglio quando e con quale frequenza eseguire nuovamente la scansione di un determinato URL.

Mappa del sito HTML

Ecco un esempio di sitemap HTML:

Esempio di mappa del sito HTML

Sembra molto diverso da una mappa del sito XML.

Questo perché è una pagina web progettata per gli esseri umani, oltre che per i robot.

Per gli esseri umani, una mappa del sito HTML aiuta una migliore navigazione attraverso un sito web.

Dal punto di vista di un motore di ricerca, una mappa del sito HTML è uno strumento utile per il rilevamento degli URL (supponendo che la mappa del sito venga scansionata e che i collegamenti contenuti nella mappa del sito vengano seguiti).

Ma questo non è il loro unico valore per la SEO:

Le sitemap HTML distribuiscono anche il PageRank in un sito web.

Poiché le mappe del sito HTML sono comunemente collegate da ogni pagina di un sito (tramite un collegamento di navigazione nel piè di pagina), hanno un sacco di PageRank che scorre verso di esse.

Piè di pagina del sito web

Ciò significa che possono trasferire un carico di barche del loro PageRank in arrivo ad altre pagine del sito Web tramite collegamenti interni.

Hai una pagina con un posizionamento scadente?

Aggiungi quella pagina alla tua mappa del sito HTML.

Può essere un modo semplice e veloce per aumentare la classifica.

Che aspetto ha una Sitemap XML?

Come ho già sottolineato, le mappe dei siti XML sono per i motori di ricerca, non per gli esseri umani.

Possono certamente sembrare confusi se non ne hai mai incontrato uno prima:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>

Tuttavia, quando sai cosa significa ciascuno di questi componenti:

  • Dichiarazione XML
  • URL impostato
  • URL
  • Ultima modifica
  • Priorità
  • Cambia frequenza

Le mappe dei siti XML sono piuttosto semplici.

Analizziamo ciascuno di essi:

Dichiarazione XML

In parole povere, la dichiarazione XML dice ai motori di ricerca che stanno leggendo un file XML.

 <?xml version="1.0" encoding="UTF-8"?>

La dichiarazione XML indica anche la versione XML e la codifica dei caratteri utilizzata.

  • La versione dovrebbe essere 1.0
  • La codifica deve essere UTF‑8.

Inserisci la dichiarazione XML nella parte superiore del file sitemap.xml.

URL impostato

L'URL impostato è un contenitore per tutti gli URL nella mappa del sito.

Inizia affermando quale standard di protocollo utilizza sitemap.xml:

 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Noterai che il protocollo menzionato nell'esempio sopra è lo standard 0.9.

Google, Yahoo e Microsoft supportano questo standard della mappa del sito: è quello che ti consiglio di utilizzare.

È importante notare che l' urlset viene chiuso nella parte inferiore del documento XML:

 </urlset>

Questo breve frammento di codice indica ai motori di ricerca che l'URL impostato è terminato.

URL

Il tag <URL> è il tag padre di ogni URL nella mappa del sito XML:

 <url> <loc>https://seosherpa.com/services/</loc> </url> <url> <loc>https://seosherpa.com/services/</loc> </url>

Tra l'apertura <url> e la chiusura </url>, devi indicare la posizione dell'URL in un tag <loc> annidato.

Ciò che è fondamentale qui è che tu indichi l'URL assoluto, incluso il suo protocollo HTTP:// o HTTPS://.

In altre parole, elenca l'URL esattamente come apparirebbe in un browser web.

URL nel browser

D'altra parte, gli URL relativi come /services/ non verranno riconosciuti.

La posizione dell'URL è l'unico attributo che DEVE essere indicato tra i tag URL.

Ma detto questo, ci sono altre tre proprietà (facoltative) che possono essere incluse:

Ultima modifica

Il tag <lastmod> determina quando il contenuto di quell'URL è stato modificato l'ultima volta.

 <lastmod>2022-01-26T19:12:36+09:00</lastmod>

Supponiamo che tu abbia aggiornato un post del blog il 10 gennaio 2022; l'attributo <lastmod> leggerebbe 2022-01-10.

Indica ai motori di ricerca quando il contenuto di quell'URL è stato rivisto l'ultima volta, il che, in teoria , influenza quando un motore di ricerca esegue nuovamente la scansione di quella pagina.

Puoi anche indicare l'ora, ma non è necessario.

Sia che tu includa solo la data o anche l'ora, assicurati di utilizzare il formato "W3C datetime".

È l'unico formato riconosciuto per il <lastmod> tag in un sitemap.xml.

Priorità

Il tag <priority> specifica la priorità dell'URL rispetto a tutti gli altri URL sul sito web.

 <priority>0.8</priority>

In altre parole, ti consente di dire ai motori di ricerca quali URL dovrebbero avere la precedenza quando assegnano il budget di scansione al tuo sito.

I valori di priorità possono essere impostati da 0,0 che è la priorità più bassa, a 1,0 che è la massima.

Il problema è che Google ignora il <priorità> nelle mappe dei siti XML, perché nelle parole di Gary Illyes "è un sacco di rumore".

Quindi non ha davvero senso stabilire la priorità.

Cambia frequenza

Considerando che il tag <lastmod> determina quando il contenuto di quell'URL è stato modificato l'ultima volta...

Il tag <changfreq> indica la frequenza con cui è probabile che il contenuto cambi.

 <changefreq>Daily</changefreq>

Il suo scopo è dare ai motori di ricerca un'idea della frequenza con cui potrebbero voler eseguire nuovamente la scansione dell'URL.

La frequenza di modifica in una mappa del sito XML può essere impostata su uno qualsiasi dei seguenti valori:

  • sempre
  • ogni ora
  • quotidiano
  • settimanalmente
  • mensile
  • annuale
  • mai

Se il tag è stato impostato su <changefreq>Settimanale</changefreq> un motore di ricerca potrebbe voler eseguire nuovamente la scansione dell'URL ogni sette giorni.

Farlo più frequentemente di quello sarebbe uno spreco in quanto è improbabile che il contenuto vari.

Tuttavia <changefreq> è obsoleto per quanto riguarda Google:

Dal momento che la maggior parte dei generatori di mappe del sito fa un lavoro orribile nell'abbinare il tag <changefreq> alla frequenza effettiva delle modifiche, è facile capire perché.

Puoi omettere l'attributo di frequenza di modifica dal tuo sitemap.xml.

Esempi di Sitemap XML

Ora che sappiamo cosa rende una mappa del sito XML, diamo un'occhiata ad alcuni esempi di sitemap.xml come appaiono nel mondo reale.

Ecco la mappa del sito XML per le pagine di Gymshark:

Questa mappa del sito potrebbe essere migliorata rimuovendo <changefreq> poiché è ignorata da Google e aggiungendo una dichiarazione XML all'inizio dell'XML della mappa del sito.

(L'inclusione di una dichiarazione XML è una procedura consigliata per tutte le mappe dei siti).

Ecco un altro esempio di mappa del sito XML, questa volta da yasisland.ae

Esempio di mappa del sito XML

Come la mappa del sito di Gym Shark, questa mappa del sito può essere migliorata aggiungendo la dichiarazione XML all'inizio.

Inoltre, la frequenza di modifica e la priorità possono essere rimosse poiché al giorno d'oggi sono ridondanti.

A parte questo, queste mappe del sito XML sono impostate correttamente.

Quindi, a questo punto, probabilmente ti starai chiedendo:

Che aspetto ha la mappa del sito XML ottimale?

Qualcosa come questo:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>

Dovrebbe contenere:

  • Dichiarazione XML (versione)
  • URL impostato
  • URL(i)
  • Ultima modifica (solo data)
Esempio di mappa del sito XML

E questo è davvero tutto.

Perché ho bisogno di una Sitemap XML?

Come ho spiegato in precedenza, un motore di ricerca scopre i contenuti sul Web eseguendo la scansione da una pagina Web all'altra utilizzando robot spesso definiti "ragni":

Motore di ricerca Spider Crawling

Quando questi spider scoprono una nuova pagina tramite un collegamento interno o esterno, aggiungono quella pagina al loro indice.

Ma il problema con la scansione?

I motori di ricerca non riescono a trovare tutti i contenuti sul Web in questo modo.

Se una pagina web non è collegata tramite un'altra pagina nota, un motore di ricerca non la troverà.

È qui che entra in gioco una mappa del sito XML.

Le mappe dei siti XML fungono da assicurazione per la scansione, informando i motori di ricerca dove trovare le pagine più importanti del tuo sito Web in modo da favorire la scoperta e l'indicizzazione dei contenuti.

Questo è fondamentale perché i motori di ricerca non possono classificare i tuoi contenuti senza prima indicizzarli.

Che tipo di siti web necessitano di una Sitemap XML?

Se segui i consigli di Google, le Sitemap XML sono le migliori per:

  • Grandi siti web con migliaia di pagine
  • Siti Web con archivi estesi
  • Siti Web con molti contenuti multimediali
  • Siti web senza o con pochissimi backlink

Ma ecco la cosa:

Tutti i siti Web traggono vantaggio dall'avere una mappa del sito XML.

Quando includi una mappa del sito XML, i bot dei motori di ricerca possono comprendere meglio la struttura del tuo sito, scoprire i tuoi contenuti e sapere quando è stato aggiornato l'ultima volta.

Anche se hai un sito Web a pagina singola, probabilmente vale la pena includere una mappa del sito XML.

Quali pagine dovresti includere nella tua Sitemap XML?

La risposta breve:

Includi tutte le pagine che desideri visualizzare nei risultati di ricerca nella tua mappa del sito XML e lascia fuori tutto il resto.

In altre parole, la tua mappa del sito dovrebbe includere solo pagine che hanno utilità. Cose come:

  • Pagina iniziale
  • Informazioni sulla pagina
  • Pagine dei prodotti
  • Pagine di servizio
  • Pagina dei contatti
  • I post del blog

In generale, non dovresti includere pagine come:

  • Grazie pagine
  • Tagga le pagine
  • File multimediali privati

Questi sono tutti esempi di URL che non vorresti venissero visualizzati nei risultati di ricerca.

Inclusioni della Sitemap XML

Ma ricorda, solo perché ometti una pagina dalla tua mappa del sito non significa che non verrà indicizzata.

Se la pagina contiene collegamenti che puntano ad essa, è possibile che Google (e altri motori di ricerca) esegua la scansione, indicizzi e visualizzi quella pagina nei risultati dei motori di ricerca.

Per garantire la rimozione di una pagina dai risultati di ricerca, ometti la pagina dalla mappa del sito XML e aggiungi un tag senza indice.

E questo mi porta al punto successivo:

Ogni pagina nella tua Sitemap XML deve essere indicizzabile.

La tua mappa del sito non dovrebbe mai contenere pagine che restituiscono questi codici di stato:

  • 404 pagina non trovata
  • 301 o 302 – Pagina spostata in un'altra posizione

I codici di stato 4XX e 3XX indicano ai motori di ricerca che non ci sono pagine lì.

E, se non c'è una pagina su quell'URL, non è indicizzabile.

Inoltre:

Ogni pagina deve essere accessibile ai crawler dei motori di ricerca.

In breve, robots.txt non sta bloccando la pagina e non ci sono direttive (come meta robot, link canonici o tag x-robots) che dicono ai motori di ricerca di non indicizzare la pagina.

Ora che sai cosa viene incluso in una mappa del sito XML, discutiamo di come crearne una.

Come creare una Sitemap XML (2 metodologie)

Se hai creato il tuo sito Web utilizzando un sistema di gestione dei contenuti come Shopify o Wix, non è necessario creare una mappa del sito XML, perché il tuo CMS genererà una mappa del sito per te.

La mappa del sito XML su queste piattaforme (e altre simili) viene aggiornata automaticamente quando le pagine vengono aggiunte o rimosse dal sito.

Se il tuo CMS non lo fa, di solito c'è un plugin che lo farà per te.

D'altra parte, se non stai utilizzando un CMS, dovrai creare manualmente una mappa del sito XML.

Analizziamo il processo:

Come creare una Sitemap XML manualmente

Se sei preoccupato di dover codificare manualmente la mappa del sito XML, non preoccuparti!

Questo processo non è realmente manuale.

Useremo Screaming Frog per fare la maggior parte del lavoro per te.

Il primo passo è installare Screaming Frog SEO Spider.

Suggerimento: puoi utilizzare la versione gratuita se il tuo sito web ha meno di trecento pagine.

Una volta installato, vai su "Modalità", quindi su "Spider".

Quindi, rilascia l'URL della tua home page nella casella "Inserisci l'URL per lo spider".

Quindi, premi "Inizia".

Screaming Frog inizierà quindi a eseguire la scansione del tuo sito web.

Una volta completata la scansione, regoliamo alcune impostazioni:

Impostazioni della mappa del sito di Screaming Frog

Poiché Google non utilizza <changefreq> e <priority>, ti consiglio di escludere quei tag dal file della mappa del sito.

Suggerisco anche di omettere <lastmod> dalla tua mappa del sito XML se stai creando una mappa del sito XML manualmente.

Come mai?

Perché è una vera seccatura dover ricostruire la mappa del sito XML ogni volta che apporti modifiche minori a una pagina.

Escludere <lastmod> dalla tua mappa del sito XML significa che non devi farlo.

Prima di estrarre il file della mappa del sito, puoi aggiungere, modificare o eliminare gli URL a seconda di ciò che desideri che i motori di ricerca scansionino e indicizzino.

Una volta che hai finito di mettere a punto la tua mappa del sito, puoi quindi caricarla nella cartella principale del tuo sito web, con "sitemap.xml" come nome del file.

Abbastanza semplice, vero?

Come creare una Sitemap XML in WordPress

Potrebbe essere una sorpresa, ma un'installazione di WordPress "pronta all'uso" non viene fornita con un creatore di mappe del sito XML.

Per generare una mappa del sito XML in WordPress avrai bisogno di un plugin, come Yoast SEO.

Ecco come aggiungere Yoast al tuo sito web, se non lo hai già installato:

All'interno della dashboard di WordPress, vai su "Plugin" e poi su "Aggiungi nuovo".

Quindi, cerca "Yoast SEO".

Plugin SEO Yoast

Quindi fai clic su "Installa ora" sul primo risultato, quindi su "Attiva".

Una volta installato Yoast, vai alle impostazioni di Yoast e seleziona "SEO", quindi "XML Sitemaps" e quindi "Generale".

In questa scheda, assicurati che "la funzionalità XML della mappa del sito sia impostata su "abilitata".

Con le mappe del sito XML attivate, ora dovresti vedere l'indice della tua mappa del sito su tuodominio.com/sitemap_index.xml.

Indice della mappa del sito Yoast

Per fortuna Yoast esclude automaticamente le pagine non indicizzabili (ad es. quelle con tag meta robots "no-index") dall'essere incluse nella mappa del sito. Detto questo, la configurazione standard dovrebbe andare bene nella maggior parte dei casi.

Se lo desideri, tuttavia, puoi scegliere di escludere determinati tipi di post e tassonomie per ottimizzare ulteriormente la tua mappa del sito:

Configurazione della mappa del sito XML Yoast

Per il sito SEO Sherpa, ho escluso media e tag dalla mia mappa del sito, perché almeno nel mio caso queste pagine hanno poco valore per gli utenti finali.

Come creare una Sitemap XML in Wix

A differenza di WordPress, Wix ha la funzionalità della mappa del sito XML integrata.

Il problema è che è piuttosto limitato.

L'unica opzione che hai è escludere determinate pagine.

Se desideri escludere una pagina, vai alla scheda delle impostazioni "SEO (Google)" per la pagina e disattiva l'interruttore "Mostra questa pagina nei risultati di ricerca".

Impostazioni del motore di ricerca Wix

Questo aggiunge un meta tag noindex alla pagina E lo esclude dalla mappa del sito XML.

Una sfida con la rigida funzionalità della mappa del sito di Wix è che include URL che sono stati canonizzati in un'altra pagina.

Questo essenzialmente dice "classifica questa pagina" e "non classificare questa pagina" allo stesso tempo, il che è molto confuso per i motori di ricerca.

Il risultato di ciò potrebbe essere la versione sbagliata visualizzata nelle pagine dei risultati di ricerca.

Se hai un sito web Wix, puoi trovare la mappa del sito generata automaticamente su tuodominio.com/sitemap.xml.

Come creare una Sitemap XML in Shopify

Non è necessario creare una mappa del sito XML se il tuo sito è stato creato con Shopify, lo fa automaticamente.

Sfortunatamente, però, non è possibile alcuna personalizzazione.

Con Shopify, non puoi nemmeno escludere una pagina dalla tua mappa del sito XML: tutto è incluso.

L'unico modo per controllare ciò che appare nei risultati di ricerca è aggiungere un tag noindex direttamente ai file .liquid.

Tuttavia, in Shopify le pagine non indicizzate verranno visualizzate nell'XML della mappa del sito, che come abbiamo sottolineato in precedenza non è l'ideale.

Trova la tua mappa del sito su tuodominio.com/sitemap.xml.

Come inviare la tua Sitemap a Google

A questo punto dovresti aver creato la tua mappa del sito.

Il passaggio finale (e forse più importante) è inviare la tua mappa del sito a Google.

Ovviamente, prima di farlo, devi sapere dove si trova la tua mappa del sito.

Se hai creato la tua mappa del sito manualmente, o stai usando Wix o Shopify, la tua mappa del sito può essere trovata al seguente URL:

tuodominio.com/sitemap.xml

D'altra parte, se il tuo sito è su WordPress e hai utilizzato Yoast per il tuo sitemap.xml, troverai l'indice della mappa del sito a questo URL:

tuodominio.com/sitemap_index.xml

Se stai utilizzando un'altra piattaforma o non riesci a trovare la tua mappa del sito in nessuna di queste posizioni, puoi controllare la tua mappa del sito utilizzando il nostro strumento di valutazione SEO:

Classificatore SEO

Una volta che sai dove si trova la tua mappa del sito XML, vai su Google Search Console e poi su "Sitemap" che troverai nel menu "Indice".

Successivamente, incolla l'URL della mappa del sito nel campo della mappa del sito e premi "Invia".

La tua mappa del sito "dovrebbe" essere inviata correttamente:

Google Search Console Invia mappa del sito riuscita

E, con questo, hai finito!

7 Best practice per le mappe del sito XML "essenziali".

Concludiamo con una serie di best practice per le mappe del sito XML.

Ti consigliamo di eseguire queste tecniche per assicurarti che la tua mappa del sito XML sia ottimizzata per una scansione e un'indicizzazione efficaci.

Entriamo.

(1). Utilizza una Sitemap dinamica NON una Sitemap statica

Immagina di dover aggiornare manualmente la tua mappa del sito XML ogni volta che hai apportato modifiche al tuo sito web?!

Bene, questo è esattamente quello che dovresti fare con una mappa del sito statica.

Per fortuna, la maggior parte dei moderni CMS ha la funzionalità di mappa del sito XML dinamica integrata o disponibile tramite un plug-in.

Che significa:

La tua mappa del sito si aggiornerà automaticamente ogni volta che aggiungi, modifichi o rimuovi pagine esistenti.

Non è necessario alcun intervento manuale.

L'uso di una mappa del sito dinamica è particolarmente importante per i siti Web di grandi dimensioni in cui le pagine prioritarie vengono aggiunte frequentemente.

Assicurati di usarne uno.

(2). Utilizza la posizione e il nome della mappa del sito standard

Se dovessi utilizzare /my_website_sitemap.xml come percorso per la tua mappa del sito XML, è possibile che i motori di ricerca non la trovino.

Per assicurarti che la tua mappa del sito sia facilmente individuabile, attieniti a posizioni standard:

https://tuodominio.com/sitemap.xml per singole mappe del sito

O

https://tuodominio.com/sitemap_index.xml quando hai più sitemap in un indice.

È così semplice.

(3). Fai riferimento alla tua Sitemap XML nel tuo file Robots.txt

Il tuo file robots.txt viene visitato dai robot dei motori di ricerca quando iniziano la scansione del tuo sito web.

Usano robots.txt per capire come eseguire la scansione del sito.

Facendo riferimento alla tua mappa del sito XML all'interno del file robots.txt, ti assicuri che i robot di ricerca possano trovarla.

Per aggiungere la tua mappa del sito XML a robots.txt, apri il file di testo robots e incolla questa riga al suo interno:

 Sitemap: https://www.yourdomain.com/sitemap.xml

Puoi trovare il file robots.txt nella directory principale del tuo server nel percorso "/robots.txt".

Se hai più sitemap XML, elencale semplicemente una per una in questo modo:

 Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml

Mentre in teoria, puoi posizionare la posizione della mappa del sito ovunque all'interno di robots.txt, generalmente è meglio posizionarla alla fine:

Riferimento alla mappa del sito di Robots txt

(4). Escludi le pagine Noindex dalla tua mappa del sito

Il ruolo di una mappa del sito XML è dire ai motori di ricerca cosa scansionare e indicizzare.

Ciò significa che dovrebbero essere incluse solo le tue pagine preferite degne di un ranking.

L'aggiunta di pagine Noindex, non canoniche o di reindirizzamento alla tua mappa del sito confonderà i motori di ricerca e potrebbe influire negativamente sul tuo budget di scansione.

(5). Mantieni la tua Sitemap XML al di sotto di 50 MB

Secondo Google, una Sitemap XML non dovrebbe superare i 50 MB o 50.000 URL.

Limite della dimensione del file della mappa del sito

Ogni volta che si supera il limite di 50 MB o 50.000 URL, è necessario dividere la singola Sitemap XML in più file XML Sitemap.

Il superamento di questi limiti potrebbe comportare l'interruzione della scansione da parte di Google.

Ad esempio, potresti dividere la tua mappa del sito in "post" e "pagine".

E poi raggruppali insieme in un file Indice Sitemap.

(6). Ignora gli attributi di priorità e frequenza di cambio

Come ho sottolineato in precedenza, Google trascura entrambi questi tag:

  • <frequenza di cambio>
  • <priorità>

Ciò significa che, inclusi gli attributi Frequenza di modifica e Priorità, si aggiunge solo un peso non necessario nella mappa del sito, che può portare a problemi di budget di scansione e indicizzazione.

Ti consiglio di non utilizzare affatto i tag <changefreq> o <priority> nella tua mappa del sito.

(7). Monitora Google Search Console per gli errori della Sitemap XML

Se Google non è in grado di eseguire la scansione della tua Sitemap XML, ti dirà tramite Search Console:

Errori della Sitemap dell'SGC

Gli errori potrebbero essere semplici come l'URL della mappa del sito XML che non è recuperabile, agli URL inviati che restituiscono codici di stato 404 o nessun indice.

I problemi più frequenti tendono ad essere:

(un). URL inviato non trovato (404)

Ciò significa che un URL che hai inviato nella tua mappa del sito XML non esiste.

Ricorda, se rimuovi una pagina dal tuo sito web, non dimenticare di rimuoverla dalla tua mappa del sito. Meglio ancora, usa una mappa del sito XML dinamica e l'URL verrà rimosso automaticamente dalla tua mappa del sito.

(b). URL inviato contrassegnato come "noindex"

Ciò si verifica quando una pagina nella tua Sitemap XML ha un meta tag "noindex".

Se vuoi che questa pagina venga indicizzata, devi rimuovere il file meta tag "noindex". Se non vuoi che venga indicizzato, rimuovilo dalla tua mappa del sito.

In ogni caso, deve essere risolto.

(c). URL inviato bloccato da robots.txt

Ciò si verifica quando una pagina contenuta nella tua Sitemap XML viene bloccata da robots.txt.

Fondamentalmente, c'è una direttiva nel tuo file robots.txt che dice ai motori di ricerca di non eseguire la scansione della pagina, anche se hai chiesto ai motori di ricerca di farlo inviandola per essere indicizzata.

Se vuoi effettivamente indicizzare l'URL, trova e rimuovi la direttiva dal tuo file robots.txt.

Strumento di test TXT per robot

Prova a testare la tua pagina utilizzando il tester robots.txt per scoprire il colpevole.

E il gioco è fatto; sette best practice per le mappe del sito XML.

Cosa ne pensi?

Ora vorrei sentirti:

Quale tecnica del post di oggi utilizzerai per prima?

Quali modifiche apporterai alla tua mappa del sito XML come risultato della lettura del post di oggi?

Forse stai per passare da una mappa del sito XML manuale a una automatizzata? O forse stai per omettere il tag <changefreq>?

In ogni caso, fammi sapere lasciando un commento qui sotto.