Contenu dupliqué : Plus n'est pas meilleur pour le référencement

Publié: 2022-07-30

Pourquoi l'expérience utilisateur est-elle importante dans la conception Web (1)

Le contenu dupliqué est identifié de deux manières. Tout d'abord, il s'agit d'un contenu qui se répète d'un site à l'autre, ou de plusieurs pages sur le même site qui contiennent de grandes sections d'informations qui disent la même chose. Dans tous les cas, la publication de contenu en double sur votre site Web peut avoir un impact négatif sur votre classement Google, même si ce n'est pas intentionnel.

À mesure qu'Internet se développe, les moteurs de recherche doivent prioriser le classement des informations afin de fournir les résultats les plus pertinents aux personnes à la recherche de réponses. Le rythme rapide auquel le contenu est publié, lu et indexé dans des catégories pour les requêtes futures est impressionnant, mais ce n'est pas parfait.

Google définit le temps et les ressources consacrés à l'exploration d'un site sous la forme d'un budget d'exploration . Il est important de réaliser que Google n'indexe pas tout sur votre site Web, même s'il le lit. Les bots AI sont chargés d'identifier les pages à indexer. Google explique que "chaque page doit être évaluée, consolidée et évaluée pour déterminer si elle sera indexée après avoir été explorée".

Il existe une foule de facteurs qui influent sur l'indexation des URL des sites Web ou sur le fait qu'ils gagnent des SERP. Différentes métriques de liens affectent également la visibilité globale de la recherche dans la recherche des mots-clés organiques que vous gagnez et les classements et impressions des moteurs de recherche.

Les meilleures pratiques de référencement auront un impact positif sur votre capacité à vous classer plus haut dans la recherche et le SEO black hat, ou choisir de mauvaises tactiques aura un impact négatif sur vos chances de vous classer haut dans la recherche, voire pas du tout. Et cela nous ramène au contenu dupliqué.

Existe-t-il une pénalité pour contenu dupliqué ?

Google déclare qu'ils ne punissent pas les sites Web pour avoir du contenu en double, mais ils ont également une clause de non-responsabilité indiquant le contraire. Si votre contenu dupliqué n'est pas le résultat de manipulations intentionnelles des résultats de recherche ou de pratiques de spam, vous ne devriez pas être pénalisé pour avoir du contenu dupliqué. Si c'est le cas, vous pouvez.

Google déclare : "Dans les rares cas où Google perçoit que du contenu en double peut être affiché dans l'intention de manipuler nos classements et de tromper nos utilisateurs, nous procéderons également aux ajustements appropriés dans l'indexation et le classement des sites concernés. En conséquence, le classement du site peut en souffrir, ou le site peut être entièrement supprimé de l'index Google, auquel cas il n'apparaîtra plus dans les résultats de recherche."

3 problèmes de contenu en double que vous voulez éviter

Le contenu dupliqué affecte l'équité des liens

"L'équité des liens" fait référence à la manière dont certains liens transfèrent l'autorité et la valeur d'une page Web à une autre.

Les moteurs de recherche souhaitent offrir la meilleure expérience utilisateur en affichant divers contenus originaux plutôt que plusieurs pages contenant le même contenu.

Le nombre de liens externes que votre page gagne est important. Selon Backlinko, le meilleur résultat de Google a 3,8 fois plus de liens que les positions deux à dix.

Pire encore, les sites Web externes peuvent être liés à une version dupliquée de votre URL préférée au lieu de votre URL préférée. Le contenu dupliqué nuit à vos campagnes de création de liens en réduisant les possibilités pour chaque lien individuel de gagner des liens externes.

Un contenu identique gaspille votre budget de crawl

Si de nombreuses pages Web contiennent du contenu en double et que vous souhaitez en indexer une, les robots d'exploration exploreront toutes les variantes en double, ce qui leur prendra du temps pour explorer d'autres pages importantes.

Votre article de blog ne sera pas indexé

Il existe deux types de contenu dupliqué : interne et externe

Le contenu dupliqué interne se produit lorsqu'un site crée du contenu dupliqué via plusieurs URL sur le même site. Les doublons externes se produisent lorsque deux sites Web différents ou plus ont la même page copiée. Les doublons externes et internes peuvent se produire sous forme de pages en double exactes ou quasi-dupliquées.

Comme je l'ai déjà mentionné, Google n'indexe pas tout sur votre site Web. Cependant, dans la Search Console , le rapport d'index sous la section Couverture, vous pouvez voir quels éléments de contenu ne sont pas indexés.

Parmi les raisons pour lesquelles les pages Google exclut le contenu qu'elles répertorient :

  • Pages avec redirections
  • Pages sans balises d'index
  • Pages en double sans balises canoniques sélectionnées par l'utilisateur
  • Pages qui ont été indexées, non soumises dans le plan du site

Comme vous pouvez le constater, les problèmes de duplication sont l'une des principales raisons pour lesquelles le contenu n'est pas indexé. C'est une perte de temps et d'argent de se concentrer sur la création de contenu qui n'apparaîtra pas dans une recherche organique, il est donc vital qu'une grande partie de votre site Web soit indexable.

Causes courantes de contenu dupliqué

Il existe de nombreuses raisons involontaires pour lesquelles votre site Web aura du contenu en double, notamment :

  • Navigation à facettes/filtrée
  • Paramètres de suivi
  • ID de session
  • HTTPS contre HTTP, et non-www contre www
  • URL sensibles à la casse
  • Barres obliques finales vs barres obliques non finales
  • URL imprimables
  • URL adaptées aux mobiles
  • URL AMP
  • Pages de balises et de catégories
  • URL des images de pièces jointes
  • Commentaires paginés
  • Localisation
  • Pages de résultats de recherche
  • Environnement de mise en scène

Quelle quantité de contenu dupliqué est acceptable ?

Bien que ce ne soit probablement pas intentionnel, les propriétaires de sites Web créent du contenu en double. Moz rapporte que certains experts estiment que jusqu'à 29 % du Web est en fait du contenu dupliqué ! Bien que certains contenus dupliqués puissent être acceptables, lorsque des articles de blog répètent plusieurs fois les mêmes informations, vous courez le risque de cannibalisation des mots clés.

Qu'est-ce que la cannibalisation des mots-clés ?

La cannibalisation des mots clés fait référence à la situation dans laquelle vous avez plusieurs articles de blog sur votre site qui peuvent chacun se classer pour le même terme de recherche dans Google. La cannibalisation se produit parce que des blocs de contenu sont répétés dans la publication ou parce que vous avez déjà optimisé un autre article pour le même mot-clé.

L'optimisation des publications et des articles pour des mots-clés similaires se fera concurrence pour la visibilité des moteurs de recherche. Habituellement, Google n'affichera qu'un ou deux résultats du même site dans les résultats de recherche pour une requête donnée. Cependant, si vous êtes un domaine faisant autorité, vous pourriez en obtenir trois.

Lorsque vous avez cannibalisé du contenu, vos propres URL entrent en concurrence dans les requêtes de recherche pour les positions de première page. Par exemple, cela pourrait être la différence entre un lien en 5e ou 6e position et deux liens en 21e et 22e positions. Lequel préféreriez-vous ?

Vous pouvez éviter la cannibalisation des mots clés en utilisant un vérificateur de contenu en double et en vous assurant que chaque type de contenu que vous publiez utilise les meilleures pratiques SEO pour un contenu de qualité.

Avez-vous besoin d'aide pour mettre à jour ou supprimer du contenu en double ?

L'équipe de contenu de SMA Marketing a une stratégie complète pour identifier le contenu dupliqué. Nous considérons chaque URL indépendamment, en adoptant une approche holistique pour mettre à jour, optimiser et supprimer le contenu. Appelez-nous!