Qu'est-ce qu'un sitemap XML et comment en créer un pour le référencement (avec exemples)

Publié: 2022-01-25

Plan du site XML petit Les sitemaps XML sont l'un des éléments les plus mal conçus de l'équation SEO.

J'ai rencontré des SEO qui n'ont pas pu expliquer pourquoi ils sont nécessaires, et encore moins vous dire comment en configurer un "correct".

Voici le hic :

Tout comme une carte est essentielle pour trouver votre destination par la route, un sitemap XML est essentiel pour que les moteurs de recherche localisent les URL de votre site Web.

Sans que vos URL ne soient explorées, elles ne seront pas indexées et vos pages ne seront pas classées (bien sûr) sans indexation.

En bref, les sitemaps XML jouent un rôle crucial dans l'optimisation des moteurs de recherche.

Dans l'article d'aujourd'hui, je vais vous montrer comment créer un sitemap XML à partir de zéro et l'optimiser parfaitement pour le référencement, étape par étape. Je couvre :

  • Qu'est-ce qu'un sitemap XML
  • Plans de site XML ou HTML
  • Balises de plan de site XML (et lesquelles utiliser)
  • Exemples de plan de site XML
  • Pourquoi avez-vous besoin d'un sitemap XML
  • Comment créer un sitemap XML
  • Six bonnes pratiques pour la création de sitemap.xml

Sans plus tarder, sautons dedans.

Qu'est-ce qu'un sitemap XML ? (Et pourquoi diable devriez-vous vous en soucier)

En termes simples :

Un sitemap XML est une feuille de route pour les moteurs de recherche.

Il répertorie le contenu important de votre site Web au format XML, afin que les moteurs de recherche puissent facilement trouver et indexer votre contenu et finalement l'afficher dans les pages de résultats des moteurs de recherche.

Qu'est-ce qu'un sitemap XML

Vous devez répertorier dans votre sitemap XML toute page Web (ou fichier) que vous souhaitez afficher dans les moteurs de recherche.

Pourquoi?

Parce qu'un sitemap garantit que votre contenu est détectable.

Supposons que vous ayez des pages Web qui ne sont liées nulle part sur votre site - ou sur le Web en général. Si ces pages n'ont pas d'hyperliens pointant vers elles, elles ne seront pas trouvables par les robots d'indexation.

Un sitemap XML (soumis aux moteurs de recherche) garantit que les moteurs de recherche peuvent trouver toutes les pages que vous souhaitez inclure dans les SERP.

Mais ce n'est pas tout.

Vous pouvez utiliser un sitemap XML pour fournir des informations supplémentaires aux moteurs de recherche, comme la date de la dernière mise à jour de votre contenu et les pages les plus prioritaires. Plus sur cela plus tard.

Plans de site XML vs HTML - Quelle est la différence ?

Vous pouvez ajouter deux types de plan de site à votre site ; un sitemap XML et un sitemap HTML.

  • Les plans de site XML utilisent un langage de balisage extensible (XML)
  • Les sitemaps HTML utilisent le langage de balisage hypertexte (HTML)
Plan de site XML vs HTML

Mais en plus du code qu'ils utilisent, ils remplissent également différentes fonctions :

Plan du site XML

Commençons par un exemple de plan de site XML :

Exemple de plan de site XML

Comme vous pouvez le constater, les sitemaps XML ne sont pas conviviaux.

Les sitemaps XML sont des flux explicitement conçus pour les moteurs de recherche.

Ils aident les moteurs de recherche comme Google à comprendre quelles URL explorer et quelles sont les priorités.

De plus, à quelle fréquence ces URL changent-elles et quelles nouvelles ont été ajoutées au site.

Fréquence d'exploration des sitemaps XML

Ces informations aident les planificateurs des moteurs de recherche à mieux évaluer quand et à quelle fréquence réexplorer une URL particulière.

Plan du site HTML

Voici un exemple de sitemap HTML :

Exemple de plan de site HTML

Il est très différent d'un sitemap XML.

C'est parce qu'il s'agit d'une page Web conçue pour les humains, ainsi que pour les robots.

Pour les humains, un sitemap HTML facilite la navigation sur un site Web.

Du point de vue d'un moteur de recherche, un sitemap HTML est un outil utile pour la découverte d'URL (en supposant que le sitemap est exploré et que les liens contenus dans le sitemap sont suivis).

Mais ce n'est pas leur seule valeur pour le référencement :

Les sitemaps HTML distribuent également le PageRank sur un site Web.

Étant donné que les sitemaps HTML sont généralement liés à chaque page d'un site (via un lien de navigation dans le pied de page), ils reçoivent une tonne de PageRank.

Pied de page du site

Cela signifie qu'ils peuvent transmettre une cargaison de leur PageRank entrant à d'autres pages du site Web via des liens internes.

Vous avez une page mal classée ?

Ajoutez cette page à votre sitemap HTML.

Cela peut être un moyen rapide et facile de lui donner un coup de pouce au classement.

À quoi ressemble un sitemap XML ?

Comme je l'ai déjà souligné, les sitemaps XML sont destinés aux moteurs de recherche, pas aux humains.

Ils peuvent certainement sembler déroutants si vous n'en avez jamais rencontré auparavant :

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>

Cependant, lorsque vous savez ce que signifie chacun de ces composants :

  • Déclaration XML
  • Ensemble d'URL
  • URL
  • Dernière modification
  • Priorité
  • changer de fréquence

Les sitemaps XML sont assez simples.

Décomposons chacun :

Déclaration XML

En termes simples, la déclaration XML indique aux moteurs de recherche qu'ils lisent un fichier XML.

 <?xml version="1.0" encoding="UTF-8"?>

La déclaration XML indique également la version XML et le codage de caractères utilisé.

  • La version devrait être 1.0
  • L'encodage doit être UTF‑8.

Placez la déclaration XML en haut du fichier sitemap.xml.

Ensemble d'URL

L'ensemble d'URL est un conteneur pour toutes les URL du sitemap.

Il commence par indiquer quelle norme de protocole le sitemap.xml utilise :

 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Vous remarquerez que le protocole mentionné dans l'exemple ci-dessus est la norme 0.9.

Google, Yahoo et Microsoft prennent en charge cette norme de plan de site - c'est celle que je vous recommande d'utiliser.

Il est important de noter que l' urlset est fermé au bas du document XML :

 </urlset>

Ce court extrait de code indique aux moteurs de recherche que l'ensemble d'URL est terminé.

URL

La balise <URL> est la balise parent de chaque URL dans le sitemap XML :

 <url> <loc>https://seosherpa.com/services/</loc> </url> <url> <loc>https://seosherpa.com/services/</loc> </url>

Entre l'ouverture <url> et la fermeture </url>, vous devez indiquer l'emplacement de l'URL dans une balise <loc> imbriquée.

Ce qui est essentiel ici, c'est que vous indiquiez l'URL absolue, y compris son protocole HTTP:// ou HTTPS://.

En d'autres termes, répertoriez l'URL exactement telle qu'elle apparaîtrait dans un navigateur Web.

URL dans le navigateur

D'autre part, les URL relatives comme /services/ ne seront pas reconnues.

L'emplacement de l'URL est le seul attribut qui DOIT être indiqué entre les balises URL.

Cela dit, trois propriétés supplémentaires (facultatives) peuvent être incluses :

Dernière modification

La balise <lastmod> détermine quand le contenu de cette URL a été modifié pour la dernière fois.

 <lastmod>2022-01-26T19:12:36+09:00</lastmod>

Supposons que vous ayez mis à jour un article de blog le 10 janvier 2022 ; l'attribut <lastmod> se lirait 2022-01-10.

Il indique aux moteurs de recherche quand le contenu de cette URL a été révisé pour la dernière fois, ce qui, en théorie , influence le moment où un moteur de recherche explore à nouveau cette page.

Vous pouvez également indiquer l'heure, mais ce n'est pas nécessaire.

Que vous incluiez uniquement la date ou l'heure également, assurez-vous d'utiliser le format "datetime W3C".

C'est le seul format reconnu pour le Balise <lastmod> dans un sitemap.xml.

Priorité

La balise <priority> spécifie la priorité de l'URL par rapport à toutes les autres URL du site Web.

 <priority>0.8</priority>

En d'autres termes, cela vous permet d'indiquer aux moteurs de recherche quelles URL doivent avoir la priorité lorsqu'ils allouent un budget de crawl à votre site.

Les valeurs de priorité peuvent être définies de 0,0 qui est la priorité la plus basse, à 1,0 qui est la priorité maximale.

Le problème, c'est que Google ignore <priority> dans les sitemaps XML, car selon les mots de Gary Illyes "c'est un sac de bruit".

Il n'y a donc vraiment aucun intérêt à établir des priorités.

Changer de fréquence

Alors que la balise <lastmod> détermine quand le contenu de cette URL a été modifié pour la dernière fois…

La balise <changfreq> indique la fréquence à laquelle le contenu est susceptible de changer.

 <changefreq>Daily</changefreq>

Son but est de donner aux moteurs de recherche une idée de la fréquence à laquelle ils pourraient vouloir réexplorer l'URL.

La fréquence de changement dans un sitemap XML peut être définie sur l'une des valeurs suivantes :

  • toujours
  • toutes les heures
  • du quotidien
  • hebdomadaire
  • mensuel
  • annuel
  • jamais

Si la balise a été définie sur <changefreq>Hebdomadaire</changefreq> un moteur de recherche peut souhaiter réexplorer cette URL tous les sept jours.

Le faire plus fréquemment que cela serait du gaspillage car le contenu ne variera probablement pas.

Cependant <changefreq> est obsolète en ce qui concerne Google :

Étant donné que la plupart des générateurs de sitemap font un travail horrible en faisant correspondre la balise <changefreq> à la fréquence réelle des changements, il est facile de comprendre pourquoi.

Vous pouvez omettre l'attribut de fréquence de changement de votre sitemap.xml.

Exemples de plan de site XML

Maintenant que nous savons ce qui constitue un sitemap XML, examinons quelques exemples sitemap.xml tels qu'ils apparaissent dans le monde réel.

Voici le plan du site XML pour les pages de Gymshark :

Ce sitemap pourrait être amélioré en supprimant <changefreq> puisqu'il est ignoré par Google, et en ajoutant une déclaration XML au début du sitemap XML.

(Inclure une déclaration XML est la meilleure pratique pour tous les sitemaps).

Voici un autre exemple de plan de site XML, cette fois de yasisland.ae

Exemple de plan de site XML

Comme le sitemap de Gym Shark, ce sitemap peut être amélioré en ajoutant la déclaration XML au début.

De plus, la fréquence de changement et la priorité peuvent être supprimées car elles sont redondantes de nos jours.

En dehors de cela, ces sitemaps XML sont correctement configurés.

Donc à ce stade, vous vous demandez probablement :

À quoi ressemble le sitemap XML optimal ?

Quelque chose comme ça:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>

Il doit contenir :

  • Déclaration XML (version)
  • Ensemble d'URL
  • URL(s)
  • Dernière modification (date uniquement)
Exemple de plan de site XML

Et, c'est vraiment tout.

Pourquoi ai-je besoin d'un sitemap XML ?

Comme je l'ai expliqué précédemment, un moteur de recherche découvre du contenu sur le Web en explorant d'une page Web à une autre à l'aide de bots souvent appelés « araignées » :

Araignée du moteur de recherche rampant

Lorsque ces robots découvrent une nouvelle page via un lien interne ou externe, ils ajoutent cette page à leur index.

Mais le problème avec le crawl ?

Les moteurs de recherche ne peuvent pas trouver tout le contenu sur le Web de cette façon.

Si une page Web n'est pas liée via une autre page connue, un moteur de recherche ne la trouvera pas.

C'est là qu'un sitemap XML entre en jeu.

Les sitemaps XML agissent comme une assurance pour l'exploration, en informant les moteurs de recherche où trouver les pages les plus importantes de votre site Web afin qu'ils facilitent la découverte et l'indexation du contenu.

Ceci est essentiel car les moteurs de recherche ne peuvent pas classer votre contenu sans l'indexer au préalable.

Quel type de sites Web a besoin d'un sitemap XML ?

Si vous suivez les conseils de Google, les sitemaps XML sont les meilleurs pour :

  • Grands sites Web avec des milliers de pages
  • Sites Web avec de nombreuses archives
  • Sites Web avec beaucoup de contenu multimédia riche
  • Sites Web avec peu ou pas de backlinks

Mais voici le truc :

Tous les sites Web bénéficient d'un sitemap XML.

Lorsque vous incluez un sitemap XML, les robots des moteurs de recherche peuvent mieux comprendre la structure de votre site, découvrir votre contenu et savoir quand il a été mis à jour pour la dernière fois.

Même si vous avez un site Web d'une seule page, l'inclusion d'un sitemap XML en vaut probablement la peine.

Quelles pages devriez-vous inclure dans votre sitemap XML ?

La réponse courte :

Incluez toutes les pages que vous souhaitez afficher dans les résultats de recherche dans votre sitemap XML et laissez tout le reste de côté.

En d'autres termes, votre sitemap ne doit inclure que les pages qui ont une utilité. Des choses comme:

  • Page d'accueil
  • À propos de la page
  • Fiches produits
  • Pages de services
  • Page de contact
  • Billets de blog

En règle générale, vous n'incluez pas de pages telles que :

  • pages de remerciement
  • Pages de balises
  • Fichiers multimédias privés

Ce sont tous des exemples d'URL que vous ne voudriez pas voir apparaître dans les résultats de recherche.

Inclusions du plan de site XML

Mais n'oubliez pas que ce n'est pas parce que vous omettez une page de votre sitemap qu'elle ne sera pas indexée.

Si la page contient des liens pointant vers elle, il est possible que Google (et d'autres moteurs de recherche) explore, indexe et affiche cette page dans les résultats des moteurs de recherche.

Pour garantir la suppression d'une page des résultats de recherche, omettez la page de votre plan de site XML et ajoutez-y une balise sans index.

Et cela m'amène à mon point suivant :

Chaque page de votre sitemap XML doit être indexable.

Votre sitemap ne doit jamais contenir de pages renvoyant ces codes d'état :

  • 404 Page non trouvée
  • 301 ou 302 – Page déplacée vers un autre emplacement

Les codes d'état 4XX et 3XX indiquent aux moteurs de recherche qu'il n'y a pas de page.

Et, s'il n'y a pas de page sur cette URL, elle n'est pas indexable.

Par ailleurs:

Chaque page doit être accessible aux robots des moteurs de recherche.

En bref, robots.txt ne bloque pas la page, et il n'y a pas de directives (telles que des méta-robots, des liens canoniques ou des balises x-robots) indiquant aux moteurs de recherche de ne pas indexer la page.

Maintenant que vous savez ce qui est inclus dans un sitemap XML, discutons de la façon dont vous en créez un.

Comment créer un sitemap XML (2 méthodologies)

Si vous avez créé votre site Web à l'aide d'un système de gestion de contenu tel que Shopify ou Wix, vous n'avez pas besoin de créer un sitemap XML, car votre CMS générera un sitemap pour vous.

Le plan du site XML sur ces plates-formes (et d'autres similaires) est automatiquement mis à jour lorsque des pages sont ajoutées - ou supprimées - du site.

Si votre CMS ne le fait pas, il existe généralement un plugin qui le fera pour vous.

D'autre part, si vous n'utilisez pas de CMS, vous devrez créer manuellement un sitemap XML.

Décomposons le processus :

Comment créer manuellement un sitemap XML

Si vous craignez de devoir coder le sitemap XML à la main, ne vous inquiétez pas !

Ce processus n'est pas vraiment manuel.

Nous allons utiliser Screaming Frog pour faire la plupart du travail à votre place.

La première étape consiste à installer Screaming Frog SEO Spider.

Astuce - vous pouvez utiliser la version gratuite si votre site Web contient moins de trois cents pages.

Une fois installé, accédez à 'Mode' puis 'Spider.'

Ensuite, déposez l'URL de votre page d'accueil dans la case intitulée "Entrez l'URL de l'araignée".

Ensuite, appuyez sur "Démarrer".

Screaming Frog commencera alors à explorer votre site Web.

Une fois le crawl terminé, nous ajustons ensuite certains paramètres :

Paramètres du plan du site Screaming Frog

Étant donné que Google n'utilise pas <changefreq> et <priority>, je recommande d'exclure ces balises du fichier sitemap.

Je suggère également d'omettre <lastmod> de votre sitemap XML si vous créez un sitemap XML manuellement.

Pourquoi?

Parce que c'est très pénible d'avoir à reconstruire le sitemap XML chaque fois que vous apportez des modifications mineures à une page.

Exclure <lastmod> de votre plan de site XML signifie que vous n'avez pas à le faire.

Avant d'extraire le fichier de sitemap, vous pouvez ajouter, modifier ou supprimer des URL en fonction de ce que vous souhaitez que les moteurs de recherche explorent et indexent.

Une fois que vous avez terminé de peaufiner votre sitemap, vous pouvez ensuite le télécharger dans le dossier racine de votre site Web, avec "sitemap.xml" comme nom de fichier.

Assez simple, non?

Comment créer un sitemap XML dans WordPress

Cela peut surprendre, mais une installation WordPress "prête à l'emploi" n'est pas livrée avec un créateur de sitemap XML.

Pour générer un sitemap XML dans WordPress, vous aurez besoin d'un plugin, comme Yoast SEO.

Voici comment ajouter Yoast à votre site Web, si vous ne l'avez pas déjà installé :

Dans votre tableau de bord WordPress, accédez à "Plugins", puis à "Ajouter un nouveau".

Ensuite, recherchez "Yoast SEO".

Plugin Yoast SEO

Cliquez ensuite sur "Installer maintenant" sur le premier résultat, puis sur "Activer".

Une fois Yoast installé, accédez aux paramètres de Yoast et sélectionnez « SEO », puis « Plans du site XML », puis « Général ».

Dans cet onglet, assurez-vous que la fonctionnalité "XML sitemap" est définie sur "activée".

Avec les plans de site XML activés, vous devriez maintenant voir votre index de plan de site sur votredomaine.com/sitemap_index.xml.

Index du plan du site Yoast

Heureusement, Yoast exclut automatiquement les pages non indexables (par exemple, celles avec une balise méta robots "sans index") d'être incluses dans le plan du site. Cela étant, la configuration standard devrait convenir dans la plupart des cas.

Si vous le souhaitez, cependant, vous pouvez choisir d'exclure certains types de publication et taxonomies pour optimiser davantage votre sitemap :

Configuration du plan de site XML Yoast

Pour le site SEO Sherpa, j'ai exclu les médias et les balises de mon sitemap, car dans mon cas du moins, ces pages ont peu de valeur pour les utilisateurs finaux.

Comment créer un sitemap XML dans Wix

Contrairement à WordPress, Wix intègre une fonctionnalité de plan de site XML.

Le problème, c'est que c'est assez limité.

La seule option que vous avez est d'exclure certaines pages.

Si vous souhaitez exclure une page, accédez à l'onglet des paramètres "SEO (Google)" de la page et désactivez l'option "Afficher cette page dans les résultats de recherche".

Paramètres du moteur de recherche Wix

Cela ajoute une balise meta noindex à la page ET l'exclut du sitemap XML.

L'un des défis de la fonctionnalité de sitemap rigide de Wix est qu'elle inclut des URL qui ont été canonisées sur une autre page.

Cela dit essentiellement "classer cette page" et "ne pas classer cette page" en même temps, ce qui est très déroutant pour les moteurs de recherche.

Le résultat pourrait être la mauvaise version affichée sur les pages de résultats de recherche.

Si vous avez un site Web Wix, vous pouvez trouver le plan du site généré automatiquement sur votredomaine.com/sitemap.xml.

Comment créer un sitemap XML dans Shopify

Vous n'avez pas besoin de créer un sitemap XML si votre site est construit avec Shopify, cela se fait automatiquement pour vous.

Malheureusement, aucune personnalisation n'est possible.

Avec Shopify, vous ne pouvez même pas exclure une page de votre plan de site XML - tout est inclus.

La seule façon de contrôler ce qui apparaît dans les résultats de recherche est d'ajouter directement une balise noindex aux fichiers .liquid.

Pourtant, dans Shopify, les pages non indexées s'afficheront dans le sitemap XML, ce qui, comme nous l'avons souligné précédemment, n'est pas idéal.

Trouvez votre sitemap sur votredomaine.com/sitemap.xml.

Comment soumettre votre sitemap à Google

À présent, vous devriez avoir créé votre sitemap.

La dernière étape (et peut-être la plus importante) consiste à soumettre votre sitemap à Google.

Bien sûr, avant de faire cela, vous devez savoir où se trouve votre sitemap.

Si vous avez créé votre sitemap manuellement, ou si vous utilisez Wix ou Shopify, alors votre sitemap se trouve à l'URL suivante :

votredomaine.com/sitemap.xml

D'autre part, si votre site est sur WordPress et que vous avez utilisé Yoast pour votre sitemap.xml, vous trouverez l'index du sitemap à cette URL :

votredomaine.com/sitemap_index.xml

Si vous utilisez une autre plate-forme - ou si vous ne trouvez pas votre sitemap dans l'un de ces emplacements, vous pouvez vérifier votre sitemap à l'aide de notre outil d'évaluation SEO :

Évaluateur de référencement

Une fois que vous savez où se trouve votre sitemap XML, allez dans Google Search Console puis 'Sitemaps' que vous trouverez sous le menu 'Index'.

Ensuite, collez l'URL de votre plan de site dans le champ de plan de site et cliquez sur "Soumettre".

Votre sitemap "devrait" être soumis avec succès :

Google Search Console Submit Sitemap Success

Et, avec cela, vous avez terminé!

7 bonnes pratiques pour les plans de site XML "essentiels"

Terminons avec une série de bonnes pratiques de plan de site XML.

Vous voudrez exécuter ces techniques pour vous assurer que votre sitemap XML est optimisé pour une exploration et une indexation efficaces.

Allons-y.

(1). Utilisez un sitemap dynamique PAS un sitemap statique

Imaginez devoir mettre à jour manuellement votre plan de site XML chaque fois que vous apportez des modifications à votre site Web ? !

Eh bien, c'est exactement ce que vous auriez à faire avec un sitemap statique.

Heureusement, la plupart des CMS modernes ont une fonctionnalité de plan de site XML dynamique intégrée - ou disponible via un plugin.

Ce qui signifie:

Votre sitemap sera automatiquement mis à jour chaque fois que vous ajouterez, modifierez ou supprimerez des pages existantes.

Aucune intervention manuelle n'est nécessaire.

L'utilisation d'un plan de site dynamique est particulièrement importante pour les grands sites Web où des pages prioritaires sont fréquemment ajoutées.

Assurez-vous d'en utiliser un.

(2). Utiliser l'emplacement et le nom du sitemap standard

Si vous deviez utiliser /my_website_sitemap.xml comme chemin pour votre sitemap XML, il est possible que les moteurs de recherche ne le trouvent pas.

Pour vous assurer que votre sitemap est facilement découvert, respectez les emplacements standard :

https://votredomaine.com/sitemap.xml pour les sitemaps uniques

OU

https://votredomaine.com/sitemap_index.xml lorsque vous avez plusieurs sitemaps dans un index.

C'est si simple.

(3). Référencez votre sitemap XML dans votre fichier Robots.txt

Votre fichier robots.txt est visité par les robots des moteurs de recherche lorsqu'ils commencent leur exploration de votre site Web.

Ils utilisent robots.txt pour comprendre comment explorer le site.

En référençant votre sitemap XML dans le fichier robots.txt, vous vous assurez que les robots de recherche peuvent le trouver.

Pour ajouter votre sitemap XML à robots.txt, ouvrez le fichier texte robots et collez-y cette ligne :

 Sitemap: https://www.yourdomain.com/sitemap.xml

Vous pouvez trouver le fichier robots.txt dans le répertoire racine de votre serveur sur le chemin "/robots.txt".

Si vous avez plusieurs sitemaps XML, listez-les simplement un par un comme ceci :

 Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml

Alors qu'en théorie, vous pouvez placer l'emplacement du sitemap n'importe où dans robots.txt, il est généralement préférable de le placer à la fin :

Référence du sitemap robots txt

(4). Exclure les pages Noindex de votre sitemap

Le rôle d'un sitemap XML est d'indiquer aux moteurs de recherche ce qu'il faut explorer et indexer.

Cela signifie que seules vos pages préférées dignes de classement doivent être incluses.

L'ajout de pages Noindex, non canoniques ou de redirection à votre sitemap confondra les moteurs de recherche et pourrait affecter négativement votre budget de crawl.

(5). Gardez votre sitemap XML en dessous de 50 Mo

Selon Google, un sitemap XML ne doit pas dépasser 50 Mo ou 50 000 URL.

Limite de taille de fichier de plan de site

Chaque fois que vous dépassez la limite de 50 Mo ou de 50 000 URL, vous devez diviser votre plan de site XML unique en plusieurs fichiers de plan de site XML.

Le dépassement de ces limites peut entraîner l'arrêt de l'exploration par Google.

Par exemple, vous pouvez diviser votre plan de site en « articles » et « pages ».

Puis regroupez-les dans un fichier d'index de sitemap.

(6). Ignorer les attributs Priority et Changefreq

Comme je l'ai souligné plus tôt, Google ignore ces deux balises :

  • <changefreq>
  • <priorité>

Cela signifie que le fait d'inclure les attributs Fréquence de modification et Priorité ne fait qu'ajouter un poids inutile dans votre sitemap, ce qui peut entraîner des problèmes de budget d'exploration et d'indexation.

Je vous recommande de ne pas du tout utiliser les balises <changefreq> ou <priority> dans votre sitemap.

(sept). Surveiller la console de recherche Google pour les erreurs de plan de site XML

Si Google n'est pas en mesure d'explorer votre sitemap XML, il vous le dira via la Search Console :

Erreurs de sitemap GSC

Les erreurs peuvent être aussi simples que l'URL du sitemap XML n'étant pas récupérable, les URL soumises renvoyant des codes d'état 404 ou aucun index.

Les problèmes les plus fréquents ont tendance à être :

(un). URL soumise introuvable (404)

Cela signifie qu'une URL que vous avez soumise dans votre sitemap XML n'existe pas.

N'oubliez pas que si vous supprimez une page de votre site Web, n'oubliez pas de la supprimer de votre sitemap. Mieux encore, utilisez un sitemap XML dynamique et l'URL sera automatiquement supprimée de votre sitemap.

(b). URL soumise marquée 'noindex'

Cela se produit lorsqu'une page de votre sitemap XML contient une balise méta « noindex ».

Si vous souhaitez que cette page soit indexée, vous devez supprimer le balise méta "noindex". Si vous ne voulez pas qu'il soit indexé, supprimez-le de votre sitemap.

Dans tous les cas, il faut le réparer.

(c). URL soumise bloquée par robots.txt

Cela se produit lorsqu'une page contenue dans votre sitemap XML est bloquée par robots.txt.

Fondamentalement, il y a une directive dans votre fichier robots.txt indiquant aux moteurs de recherche de ne pas explorer la page, même si vous avez demandé aux moteurs de recherche de le faire en la soumettant à indexation.

Si vous souhaitez réellement que l'URL soit indexée, recherchez et supprimez la directive de votre fichier robots.txt.

Outil de test Robots TXT

Essayez de tester votre page à l'aide du testeur robots.txt pour découvrir le coupable.

Et voila; sept meilleures pratiques de plan de site XML.

Qu'est-ce que tu penses?

Maintenant, j'aimerais avoir de vos nouvelles :

Quelle technique du post d'aujourd'hui allez-vous utiliser en premier ?

Quels changements allez-vous apporter à votre plan de site XML à la suite de la lecture de l'article d'aujourd'hui ?

Peut-être allez-vous passer d'un sitemap manuel à un sitemap XML automatisé ? Ou peut-être allez-vous omettre la balise <changefreq> ?

Quoi qu'il en soit, faites-le moi savoir en laissant un commentaire ci-dessous.