URL canoniques : guide du débutant sur les balises canoniques

Publié: 2022-05-09

Comprendre ce qui est canonique et comment l'utiliser correctement est essentiel pour le référencement. Une mise en œuvre incorrecte du canonique peut entraîner un large éventail de problèmes qui ont un impact négatif sur le classement de votre site Web.

Introduites pour la première fois en 2009, les balises canoniques ont aidé les webmasters à résoudre le problème du contenu très similaire ou dupliqué accessible sur différentes URL. Cependant, si vous souhaitez utiliser la balise canonique, vous devez comprendre ce que c'est, comment cela fonctionne et comment vous pouvez l'implémenter.

Ce guide vous aidera à faire de même. Lisez la suite pour en savoir plus sur la balise canonique.

Qu'est-ce qu'une balise canonique ou une URL canonique - La définition

La balise canonique est un élément HTML qui indique au moteur de recherche d'ignorer toutes les autres versions d'une page et de considérer celle marquée dans l'URL canonique à des fins de classement.

capture d'écran de la balise canonique

Cela s'avère pratique lorsque vous avez plusieurs pages avec un contenu similaire et que vous ne voulez pas que les moteurs de recherche les classent dans la catégorie du contenu en double.

Ils peuvent être trouvés dans le code HTML d'une page sous la balise head. Il peut pointer vers sa propre URL ou l'URL d'une autre page pour consolider les signaux vers les moteurs de recherche.

Un lien canonique ou une URL canonique est la version du contenu que vous souhaitez que votre public et Google voient au lieu d'autres pages en double.

À quoi ressemble une balise canonique ?

La balise canonique est une syntaxe facile à utiliser qui est placée sous la section <head> de votre page Web : Voici à quoi elle ressemble :

<link rel="canonical" href="https://website.com/sample-page/" />

Avantages SEO de la canonisation et pourquoi est-ce important ?

Le contenu dupliqué n'est pas apprécié par les moteurs de recherche. En effet, il est difficile de trouver la bonne version d'une page à des fins d'indexation et de classement. De plus, les pages en double provoquent des problèmes de cannibalisation dans lesquels «l'équité des liens» est répartie entre plusieurs pages avec le même contenu. De cette façon, aucune des pages n'obtient un avantage de classement.

De plus, avoir beaucoup de contenu dupliqué sur votre site Web peut avoir un impact négatif sur votre budget de crawl. Cela signifie que les moteurs de recherche perdront plus de temps à explorer les multiples versions d'une même page au lieu de rechercher du contenu important.

Vous devez éviter le contenu en double, car vous ne voulez pas que les moteurs de recherche perdent leur temps à parcourir des pages pour lesquelles vous ne souhaitez pas vous classer. Cependant, selon Google, même si vous avez du contenu en double, ce ne sera pas un problème. Si votre site Web contient moins de quelques milliers d'URL, dans la plupart des cas, il sera exploré efficacement. Si vous rencontrez des problèmes à cause du budget de crawl, les balises canoniques peuvent vous aider à les résoudre. Grâce à ceux-ci, les moteurs de recherche sauront quelle version de la page ils sont censés indexer et classer.

Que se passe-t-il lorsque vous n'avez pas spécifié de page canonique ?

Si vous n'ajoutez pas d'URL canonique, les moteurs de recherche utiliseront leur discrétion et identifieront une page que leur algorithme considère comme la meilleure version. Cela peut être un problème s'ils sélectionnent une version pour laquelle vous ne voulez pas vous classer. Soit dit en passant, les moteurs de recherche peuvent ne pas toujours respecter l'URL canonique que vous avez définie. Ils n'utilisent pas les balises comme directives mais comme conseils. L'utilisation des meilleures pratiques pour les balises canoniques devrait atténuer le risque que les moteurs de recherche utilisent une version indésirable comme canonique. Fondamentalement, assurez-vous que les pages que vous canonisez sont liées.

Raisons pour lesquelles le contenu dupliqué existe

Dans certains cas, la création de pages en double ou « sensiblement similaires » est intentionnelle car elles servent à des fins différentes.

Prenons un exemple où vous avez des clients dans différents pays. Dans ce cas, vous aurez besoin de deux pages de produits qui ont des prix différents mais qui sont par ailleurs presque identiques. Vous pouvez utiliser des balises canoniques pour ces pages afin d'indiquer aux moteurs de recherche quelle page servir en fonction de l'emplacement du visiteur. De plus, il peut y avoir des raisons techniques pour avoir du contenu en double et vous ne le savez peut-être même pas. Si vous avez un site Web dynamique ou utilisez des systèmes de gestion de contenu, vous risquez de vous retrouver avec du contenu en double.

Certains sites Web ajoutent automatiquement des balises permettant plusieurs chemins vers les mêmes paramètres de contenu tels que les tris, les recherches ou les devises. Ainsi, cela pourrait finir par créer plusieurs URL en double sur votre site Web sans que vous en soyez conscient. Heureusement, avec les URL canoniques, les moteurs de recherche peuvent identifier différentes variantes d'une page et éviter les problèmes associés au contenu dupliqué.

Plusieurs URL avec le même contenu - Quel est le dilemme ?

Lorsqu'il y a du contenu en double sur votre site Web, cela peut affecter votre classement et vous faire perdre du trafic. Ces pertes proviennent des deux problèmes suivants :

  • Les moteurs de recherche n'affichent pas plusieurs versions du contenu afin de fournir la meilleure expérience. Alors, ils choisissent une version qu'ils pensent être le meilleur résultat. Si cela vous arrive, la visibilité de vos doublons sera diluée.
  • Cela peut également diluer l'équité des liens, car d'autres sites Web choisissent également entre les doublons. Ainsi, au lieu de liens entrants pointant vers un contenu, ils seront liés à différentes pages et répartiront l'équité du lien.

Le contenu dupliqué peut également créer des problèmes pour les moteurs de recherche :

  • Ils ne connaissent pas la version qui doit être incluse ou exclue de l'index.
  • Ils ne savent pas s'ils doivent diriger les métriques de lien vers une page ou les séparer entre différentes pages.
  • Ils ne savent pas quelle page doit être classée pour les résultats de la requête.

Meilleures pratiques pour les balises canoniques

La mise en œuvre des canoniques est facile. Voici quelques-unes des meilleures pratiques que vous pouvez utiliser :

  • Utiliser des URL absolues

Vous ne devez pas utiliser de chemins relatifs pour l'élément de lien rel="canonical". Ainsi, au lieu d'utiliser cette structure :

<link rel="canonical" href="/sample-page/" />

Vous devez utiliser cette structure :

<link rel="canonical" href="https://website.com/sample-page/" />

  • Utilisation d'URL en minuscules

Il est possible que les moteurs de recherche traitent les URL en minuscules et en majuscules comme étant différentes. Forcez les URL en minuscules sur votre site Web et utilisez-les également pour vos balises canoniques.

  • Utilisation de la bonne version du domaine (HTTPS vs. HTTP)

Si vous passez à SSL, vous ne devez pas déclarer d'URL non SSL dans les balises canoniques. En faisant cela, cela pourrait conduire à des résultats inattendus et à beaucoup de confusion. Si votre site Web se trouve sur un domaine sécurisé, au lieu de la version suivante de l'URL :

<link rel="canonical" href="https://example.com/sample-page/" />

Vous devez utiliser la version suivante :

<link rel="canonical" href="http://example.com/sample-page/" />

Si vous n'utilisez pas HTTPs, le contraire sera vrai.

  • Utiliser une balise canonique auto-référentielle

Une balise canonique autoréférentielle est une balise canonique qui pointe vers la même page. Même si l'utilisation de balises canoniques auto-référentielles n'est pas obligatoire, elle est recommandée. En effet, cela indique clairement aux moteurs de recherche quelles pages doivent être indexées. Que ce soit à cause des paramètres à la fin ou à cause des majuscules/minuscules, il peut y avoir différentes variations d'URL. Tout cela est nettoyé à l'aide d'une balise canonique rel.

Ainsi, si l'URL est https://example.com/sample-page , le canonique auto-référentiel sera :

<link rel="canonical" href="https://example.com/sample-page" />

Certains CMS populaires ajoutent automatiquement une URL d'auto-référence. Dans le cas d'un CMS personnalisé, vous aurez peut-être besoin d'un développeur pour le coder en dur.

  • Utiliser une balise canonique par page

Si votre page Web comporte plusieurs balises canoniques, toutes seront ignorées par les moteurs de recherche.

Comment implémenter avec précision la balise rel=canonical

Définition d'une URL canonique à l'aide d'une balise HTML

Le moyen le plus simple pour vous de spécifier l'URL canonique consiste à utiliser la balise rel=canonical. Vous pouvez ajouter la syntaxe suivante à la section <head> de la page en double :

<link rel="canonical" href="https://example.com/canonical-page/" />

Par exemple, si le contenu de votre page Web est accessible via d'autres URL, vous ajoutez la balise canonique aux pages en double. Si vous utilisez CMS, vous n'aurez pas à vous soucier du code.

Définir une URL canonique sur Magento et Magento 2

Pour définir l'URL canonique sur Magento, voici ce que vous pouvez faire :

  1. Connectez-vous au 'Panneau d'administration'. Cliquez sur l'onglet 'Magasins' suivi de 'Paramètres' et 'Configuration'.
  2. Cliquez sur l'option 'Catalogue' et choisissez 'Catalogue' dans le menu déroulant. Ensuite, vous devez ouvrir la section 'Search Engine Optimization'. Après cela, vous devez apporter les modifications suivantes :
    1. Si vous souhaitez indexer les pages avec uniquement le chemin complet de l'URL de la catégorie, voici ce que vous pouvez faire :
      1. Utilisez la balise méta de lien canonique pour les catégories - "Oui" ;
      2. Utilisez la balise méta de lien canonique pour les produits - 'Non' ;
    2. Si vous souhaitez uniquement indexer la page produit, vous devez effectuer les réglages suivants :
      1. Utilisez la balise méta de lien canonique pour les catégories – « Non » ;
      2. Utilisez la balise méta de lien canonique pour les produits - 'Oui' ;
    3. Si vous souhaitez indexer des produits et des catégories, vous devez activer les deux options :
      1. Utilisez la balise méta de lien canonique pour les catégories - "Oui" ;
      2. Utilisez la balise méta de lien canonique pour les produits - 'Oui' ;

Une fois que vous avez terminé, vous devez vider le cache et enregistrer les modifications.

Définir une URL canonique sur WordPress

Pour définir l'URL canonique sur WordPress, vous devez installer Yoast SEO. Il ajoutera automatiquement les balises canoniques auto-référencées. Afin de définir les canoniques personnalisés, vous devez utiliser la section "Avancé".

balise canonique wordpress

Définir une URL canonique sur Wix

Sur Wix, l'URL canonique est automatiquement créée pour toutes les pages. Si vous souhaitez modifier l'onglet canonique ou avoir plusieurs URL vers la même page, vous pouvez apporter les modifications en conséquence dans l'onglet SEO avancé.

Définir une URL canonique sur Shopify

Si vous utilisez Shopify, des URL canoniques auto-référencées sont automatiquement ajoutées aux articles de blog et aux produits. Vous pouvez modifier directement les fichiers de modèle pour définir des URL canoniques personnalisées.

Définition d'une balise canonique dans l'en-tête HTTP

Dans le cas de documents tels que les PDF, il n'y a pas de section <head> où vous pouvez placer les balises canoniques. Vous pouvez facilement le faire en ajoutant le code canonique dans la section d'en-tête de votre fichier PHP.

URL canoniques dans les sitemaps

Selon Google, vous ne devriez pas inclure de pages non canoniques dans les sitemaps. Vous ne devez répertorier que les URL canoniques. En effet, Google utilise les pages du sitemap comme canoniques recommandées. Cependant, cela ne signifie pas toujours que les URL répertoriées dans les sitemaps seront sélectionnées comme canoniques.

Cela les aide à définir les canoniques pour un grand site Web et les plans de site peuvent indiquer au moteur de recherche les pages que vous considérez comme les plus importantes.

Définir des canoniques avec des redirections 301

Vous pouvez utiliser des redirections 301 pour détourner le trafic des URL en double vers l'URL canonique. Vous pouvez faire de même pour les versions www/no-www et HTTPs/HTTP du site Web. Vous devez sélectionner une version canonique et rediriger les doublons vers cette version.

Utilisations avancées de rel=canonical

Parlons maintenant de certaines des utilisations avancées de rel=canonical que tout le monde ne connaît pas :

  • Utiliser rel=canonical sur différentes pages

En ce qui concerne rel=canonical, Google l'honore à l'extrême, ce qui signifie que vous pouvez canoniser un contenu en un contenu totalement différent. Cependant, si vous êtes surpris en train de faire cela, il est possible que le moteur de recherche ne fasse plus confiance à vos canoniques.

  • Utiliser rel=canonical avec hreflang

Lors de l'utilisation de hreflang, il est crucial que le canonique de chaque langue pointe vers lui-même. Si vous implémentez hreflang, assurez-vous que vous savez comment utiliser correctement canonique, sinon vous pourriez finir par tuer votre implémentation hreflang.

Erreurs courantes de canonisation et correctifs

Points canoniques vers 4XX

Lorsque vous avez des pages canonisées en une URL 4XX, vous recevez cet avertissement. Les moteurs de recherche n'indexeront pas ces pages et ignoreront les balises canoniques pointant vers ces pages. En conséquence, il finira par indexer la mauvaise version de la page. Après avoir examiné les pages, vous devez utiliser les liens vers la page de travail pour remplacer les liens canoniques morts.

Points canoniques vers 5XX

Les codes d'état 5XX signifient qu'il y a des problèmes de serveur qui mèneront à une page inaccessible. Les moteurs de recherche n'indexeront pas ces pages et les ignoreront si vous les canonisez. Ce que vous devez faire est de remplacer les URL canoniques erronées. Si le canonique semble correct, vous devez vérifier les erreurs de configuration du serveur. Cependant, si vous recevez cet avertissement alors que le serveur de votre site est surchargé ou lorsque votre site est arrêté pour maintenance, il ne s'agit que d'un problème temporaire.

Points canoniques à rediriger

Lorsque les pages sont canonisées vers une URL redirigée 301, c'est à nouveau un motif de préoccupation. Il est crucial pour les canoniques d'avoir une version faisant autorité de la page. Si vous ajoutez une URL de redirection, les moteurs de recherche ignoreront ou interpréteront mal le canonique.

Pages en double sans canonique

Puisqu'il n'y a pas d'URL canonique, les moteurs de recherche essaieront d'identifier la version la plus appropriée. Cependant, il se peut que ce ne soit pas la page que vous souhaitez indexer.

L'URL canonique n'a pas de liens internes entrants

Lorsque vos URL canoniques spécifiées n'ont pas de liens entrants internes, également appelés pages orphelines, elles deviennent inaccessibles à vos visiteurs et moteurs de recherche. Au lieu de cela, ils peuvent être redirigés vers la version non canonique de la page Web.

Page non canonique dans le plan du site

Si vous avez des pages non canoniques répertoriées dans le sitemap, Google peut considérer ces pages comme des pages canoniques suggérées. Pour résoudre ce problème, vous devez supprimer ces URL non canoniques du sitemap.

Pages non canoniques spécifiées comme pages canoniques

Ce problème se déclenche lorsque vous spécifiez une URL canonique qui est également canonisée sur une autre page, ce qui entraîne une chaîne canonique. Cela peut dérouter les moteurs de recherche. Par exemple, si A est canonisé en B et B est canonisé en C, vous devez remplacer le lien canonique de A par le lien canonique de C.

L'URL d'Open Graph ne correspond pas au canonique

Cela se produit lorsqu'il y a une incompatibilité entre l'URL canonique que vous avez spécifiée et l'URL Open Graph sur les pages. Il en résulte la version non canonique partagée sur les réseaux sociaux. L'URL Open Graph doit être remplacée par l'URL canonique et les deux URL doivent être identiques.

Canonique de HTTPS à HTTP

Cela se produit lorsque vous avez des pages HTTP sécurisées qui ont une version HTTP non sécurisée comme canonique. Pour résoudre ce problème, vous devez rediriger la page HTTP vers son équivalent HTTPS. Si vous ne pouvez pas le faire, vous pouvez ajouter le lien ref=”canonical” de la version HTTP à celui HTTPS.

Canonique de HTTP à HTTPS

Cet avertissement est déclenché lorsque vous avez des pages HTTP sécurisées qui ont une version HTTPS sécurisée comme canonique. Vous devez commencer par implémenter une redirection 301 de HTTP vers HTTPS, puis passer au remplacement des liens internes de la version HTTP directement vers la version HTTPS.

La page non canonique reçoit du trafic organique

Si des pages non canoniques continuent d'apparaître dans les résultats de recherche et reçoivent du trafic de recherche organique, cela signifie que le moteur de recherche a ignoré votre canonique spécifié. Pour résoudre ce problème, vous devez vous assurer que les balises rel=canonical sont correctement configurées. Ensuite, vous devez vérifier l'outil d'inspection d'URL pour voir si l'URL canonique que vous avez spécifiée est considérée comme canonique.

Blocage de l'URL canonique via robots.txt

Si vous bloquez une URL canonique dans robots.txt, le moteur de recherche ne pourra pas l'explorer, ce qui signifie qu'il ne verra pas les balises canoniques sur cette page Web. Cela empêche le moteur de recherche de transférer l'équité des liens d'URL non canoniques vers des URL canoniques.

Définition de l'URL canonique sur 'noindex'

Vous ne devriez pas rel=canonical et noindex car ce sont des instructions contradictoires. Il est important de noter que la balise canonique est prioritaire sur la balise 'noindex' par Google. Si vous souhaitez canonique et noindexer une URL, vous pouvez utiliser une redirection 301 ou rel=canonical.

Comment auditer les balises canoniques pour le référencement

Lors de l'audit des balises canoniques, vous devez vérifier un certain nombre de choses pour des performances SEO optimales, notamment :

  • Si oui ou non la page a une balise canonique ?
  • S'il a une balise canonique, pointe-t-elle vers la bonne page ?
  • La page est-elle indexable et explorable ?

Voici quelques façons d'inspecter et d'auditer les balises canoniques :

  1. Voir la source

Pour vérifier le code source, vous devez cliquer avec le bouton droit sur le navigateur et cliquer sur "afficher la source". Vous pouvez également le saisir dans la barre d'adresse sous la forme view-source:(adresse de la page).

  1. Solutions logicielles de référencement

Il existe plusieurs logiciels d'audit de site SEO en ligne qui vous aident à auditer les balises canoniques en masse.

Comme mentionné précédemment, la canonisation est un concept important pour le référencement. Sans une mise en œuvre appropriée, votre site Web ne fonctionnera pas à ses performances optimales. Cela étant dit, une fois que vous aurez compris ce qu'est une URL canonique, ce qu'est une balise canonique, ce qu'ils font et comment vous pouvez résoudre les problèmes de canonisation, vous pourrez les utiliser correctement et vous occuper du contenu dupliqué sur votre site Web. .