Comment résoudre les problèmes de contenu dupliqué sur votre site Web
Publié: 2019-06-11Le contenu dupliqué est une préoccupation SEO majeure. C'est là-haut avec des liens douteux et en évitant les pénalités de Google. Avoir du contenu en double peut nuire au trafic organique de n'importe quel site. Toutes les personnes impliquées dans le référencement le comprennent. Cela ne signifie pas que le contenu dupliqué est facile à éviter. Malgré tous vos efforts, votre site peut encore souffrir de problèmes de contenu dupliqué.
Ce guide est conçu pour vous aider à résoudre ces problèmes. Nous allons vous indiquer les principales façons dont le contenu dupliqué peut se produire. Nous entrerons ensuite dans le vif du sujet de ce que vous pouvez faire pour éviter et résoudre les problèmes de contenu en double. Mais d'abord, il vaut la peine d'expliquer ce qu'est le contenu dupliqué et pourquoi c'est important.
Réserver une consultation
Contenu dupliqué et Google
La meilleure façon d'expliquer ce qu'est le contenu dupliqué est de regarder comment Google le définit lui-même. Dans leurs directives de support concernant le contenu dupliqué, ils proposent la définition suivante :
"Des blocs de contenu substantiels dans ou entre des domaines qui correspondent complètement à d'autres contenus ou qui sont sensiblement similaires."
C'est assez simple car c'est pourquoi le contenu dupliqué est important. C'est à cause de la façon dont cela affecte ce que Google vise à fournir à ses utilisateurs. Le moteur de recherche s'efforce d'indexer et d'afficher des pages avec des informations distinctes. Cela fait partie de leur désir constant d'assurer une meilleure expérience utilisateur.
Les pages avec du contenu en double ne sont pas considérées comme ayant des informations distinctes. En tant que tel, Google filtrera ces pages en double. Cela signifie qu'une seule des pages présentant un contenu dupliqué sera répertoriée. Cela peut avoir un effet négatif profond sur le trafic organique d'un domaine. Les pages qui, autrement, généreraient plus de trafic vers un site ne seront pas du tout répertoriées.
C'est une idée fausse courante que Google impose des pénalités pour le contenu dupliqué. Ce n'est pas le cas, mais s'ils soupçonnent une utilisation malveillante de contenu dupliqué, ils agiront. Ce serait lorsque le contenu est utilisé pour manipuler leur classement. Dans ce cas, ils :
'Faire les ajustements appropriés dans l'indexation et le classement des sites concernés. En conséquence, le classement du site peut en souffrir ou le site peut être entièrement supprimé de l'index Google. Dans ce cas, il n'apparaîtra plus dans les résultats de recherche.'
À présent, il devrait être évident que vous souhaitez éviter le contenu en double sur votre site. Même si vous faites attention à le faire, cela peut toujours se produire. Cela peut se produire de plusieurs façons.
Comment le contenu dupliqué peut-il se produire
Comme nous l'avons déjà mentionné, le contenu dupliqué peut être délibérément présenté sur un domaine. Généralement pour essayer de tromper ou de manipuler les classements de Google. Chaque professionnel du référencement sait désormais à quel point les algorithmes de Google sont intelligents. Seuls les plus stupides ou les plus indifférents d'entre eux penseraient qu'ils pourraient s'en tirer avec une telle manipulation.
C'est beaucoup plus souvent le cas que le contenu dupliqué sur un site s'est développé naturellement. Cela sera soit dû à certains problèmes techniques, soit à une simple erreur humaine. Il est important de comprendre les principales façons dont cela peut se produire. Cela vous aidera à identifier vos propres problèmes de contenu dupliqué. Cela facilitera également le choix de la meilleure solution possible.
Les causes du contenu dupliqué dont nous allons discuter sont les suivantes :
- Paramètres d'URL pour le filtrage et le suivi
- Croisement de page de catégorie de produit
- Descriptions de produits en double
- Problèmes techniques avec les URL
- Pages imprimables
- Problèmes de création de contenu
Paramètres d'URL pour le filtrage et le suivi
Les paramètres d'URL sont comme des suffixes ajoutés à la fin de l'URL d'une page. Ils se produisent dans de nombreuses situations et souvent ne modifient pas beaucoup le contenu d'une page, voire pas du tout. Le problème est que pour un moteur de recherche, une URL avec un paramètre différent à la fin est une URL différente. Si le contenu lié par les "deux" URL est le même, Google l'identifiera comme contenu en double.
Un excellent exemple de cela vient du filtrage des produits sur les sites de commerce électronique. Presque tous ces types de sites permettent aux clients de filtrer les produits. Ils peuvent souhaiter n'afficher que des produits dans une certaine gamme de prix ou fabriqués dans un matériau particulier. Le fait de filtrer les produits ajoute un paramètre d'URL à l'URL. Le contenu affiché - les produits, etc. - sera cependant dupliqué ailleurs.
Un autre exemple est dans le cas du suivi. Les paramètres de suivi vous permettent de suivre les sources des visiteurs de votre site. Cela peut être crucial pour le suivi du retour sur investissement des différents efforts de référencement. Ils peuvent ressembler à ceci : '/?source=rss'. Ils n'ont aucun impact sur le contenu d'une page mais se tournent également vers un moteur de recherche comme une URL unique.
Croisement de page de catégorie de produit
Un autre problème particulier aux sites de commerce électronique est celui du croisement des pages de catégorie. De nombreux sites auront des pages de catégories différentes qui affichent principalement les mêmes produits. Cela se fait souvent pour des raisons bien intentionnées et compréhensibles.
Par exemple, un site de cadeaux peut avoir des catégories nommées "Cadeaux pour lui" et "Cadeaux pour la fête des pères". Les deux catégories pourraient bien attirer des clients différents. Les produits affichés sur les pages de catégories seront cependant presque identiques. C'est tout ce qui comptera pour Google et ils pourraient bien n'indexer qu'une seule des pages.
Dupliquer les descriptions de produits
Un niveau plus bas sur les sites de commerce électronique à partir des pages de catégories sont les pages de produits. Ceux-ci peuvent également être une source courante de problèmes de contenu dupliqué. Les visiteurs de ces pages s'attendront à ce qu'il y ait une courte description du produit. Ce sera la façon dont les caractéristiques et les caractéristiques du produit seront vendues aux clients.
Les sites qui vendent beaucoup de produits ne créent souvent pas de descriptions uniques pour chacun. De nombreuses entreprises se contentent de copier et coller des informations génériques. Souvent, cela a été fourni par un fournisseur ou un fabricant. Cela conduit à des charges de contenu en double dans et entre différents domaines.
Les plus gros problèmes dans ce cas seront si votre site vend les mêmes produits qu'un détaillant beaucoup plus important comme Amazon. Les descriptions copiées peuvent conduire votre page produit à dupliquer le contenu trouvé sur Amazon. Google indexera certainement la page d'Amazon plutôt que la vôtre.
Problèmes techniques avec les URL
En plus des paramètres d'URL, il existe quelques autres problèmes techniques d'URL qui peuvent entraîner des problèmes de contenu en double. Le premier se présente sous la forme d'« identifiants de session ». Ceux-ci sont utilisés dans les URL lorsque les visiteurs du site reçoivent une "session". C'est souvent pour qu'ils puissent ajouter des articles à un panier et qu'ils y restent.
Les identifiants de session sont ajoutés à chaque lien interne lorsqu'un visiteur parcourt votre site. Cela crée de nombreuses URL qu'un moteur de recherche peut considérer comme du contenu en double. Dans le même ordre d'idées, les URL désordonnées faisant partie d'un CMS peuvent avoir un effet similaire. Les URL avec des paramètres pour la catégorie et l'article qui changent d'ordre sont d'excellents exemples.
Pages imprimables
Votre CMS pourrait bien créer des pages imprimables. Ces pages seront liées sur votre site à partir des pages d'articles et ailleurs. Google pourra trouver ces pages à moins que vous ne les arrêtiez spécifiquement (plus à ce sujet plus tard).

Google filtrera et indexera une seule des pages en double. Il peut s'agir de la version originale ou de la version imprimable. Vous voulez que votre page d'origine soit classée, pas celle qui convient à l'impression. Ce dernier n'aura pas toutes vos annonces, liens et autres contenus.
Problèmes de création de contenu
La plupart des éléments ci-dessus sont des causes techniques de problèmes de contenu dupliqué. Là où l'erreur humaine entre en jeu, c'est dans le domaine de la création de contenu. Presque tous les sites de nos jours ont un blog ou une ressource d'information similaire. Cela les aide à fournir des informations utiles aux visiteurs. Les blogs peuvent souvent abriter de nombreux contenus dupliqués.
Cela peut être dû au fait que vous confiez la création de contenu à quelqu'un que vous ne devriez pas. Quelqu'un qui ne comprend pas les problèmes que le contenu dupliqué peut causer. Ils peuvent copier ou recréer du contenu sans connaître les problèmes de référencement qu'ils créent. Leurs erreurs pourraient être aussi minimes que de toujours utiliser les mêmes balises de titre. Ils peuvent être aussi volumineux que copier directement le contenu d'autres sites.
Résoudre les problèmes de contenu dupliqué
Vous devriez maintenant avoir une idée de l'origine de vos problèmes de contenu dupliqué. Ce qui précède sont toutes les causes de ces problèmes qui sont communs à de nombreux sites. Les comprendre et savoir lesquels ont affecté votre site est crucial. C'est parce que les différentes causes se prêtent à des solutions différentes.
Nous allons passer en revue certaines des meilleures façons de résoudre les problèmes de contenu dupliqué. Nous signalerons les problèmes et les causes que nous avons déjà mentionnés qui correspondent le mieux à chaque solution au fur et à mesure. Nos solutions s'inscrivent dans deux catégories :
- Solutions éducatives et préventives
- Solutions pratiques et efforts de récupération
Solutions éducatives et préventives
Dans un monde idéal, vous voulez éviter les problèmes de contenu dupliqué avant qu'ils ne surviennent. Connaître les causes des problèmes dont nous avons discuté est un excellent point de départ. Avoir cette connaissance peut vous aider à prendre des mesures pour vous assurer qu'aucun nouveau contenu ne rencontrera les mêmes problèmes.
Vous pouvez, par exemple, désactiver les identifiants de session dans vos paramètres système. Cela évitera les problèmes d'URL en double que ceux-ci peuvent causer. Vous pouvez choisir de ne pas inclure du tout de pages imprimables sur votre site Web. Ce n'est pas comme si beaucoup de gens avaient de toute façon des raisons d'imprimer des pages de nos jours. Une campagne de suivi basée sur des hashtags peut également être une bonne alternative au suivi basé sur des paramètres.
Après avoir appris les causes du contenu dupliqué, vous êtes en mesure d'éduquer les autres. Il peut s'agir de développeurs Web ou de votre équipe produit. Vous pouvez leur expliquer les problèmes liés au croisement dans les catégories de produits. De cette façon, ils sauront organiser les produits en conséquence. Les créateurs de contenu indépendants ou internes peuvent également être informés de la façon de garder les choses uniques.
C'est dans un monde idéal. En réalité, vous ne pourrez peut-être pas devancer tous vos problèmes de contenu dupliqué. Dans ces circonstances, vous avez besoin de solutions pratiques. Ils seront ce qui peut vous aider à vous remettre des problèmes dont vous souffrez déjà.
Solutions pratiques et efforts de récupération
Jusqu'à présent, notre guide aurait dû vous montrer d'où pouvaient provenir vos problèmes de contenu dupliqué. Nous avons également proposé quelques conseils pour éviter que d'autres problèmes ne surviennent. Il ne reste plus qu'à suggérer quelques pistes d'action si votre site a déjà des problèmes de contenu dupliqué. De nombreuses options s'offrent à vous.
URL canoniques
Les URL canoniques peuvent vous aider si votre problème concerne différentes URL menant au même contenu. Comme dans le cas des paramètres de filtrage ou des pages de catégorie, comme décrit précédemment. Une URL canonique est l'URL "correcte". Il s'agit de l'URL de la page que vous souhaitez que Google indexe parmi celles menant au même contenu. Vous devez décider dans chaque cas de quelle page il s'agit.
Une fois identifié, il est simple de dire à Google quelle page est votre URL canonique. Tout ce que vous avez à faire est d'ajouter un élément HTML à la section <head> des autres pages. Appelé 'élément de lien canonique', il ressemble à ceci ; 'rel=canonique'. Il pointera Google vers la page que vous avez choisie lorsqu'il sera suivi de son URL.
Redirections 301
Faire pointer Google vers des URL canoniques est parfois décrit comme l'utilisation de "redirections logicielles". C'est par opposition aux redirections 301 à part entière. Vous pouvez également les utiliser si vous ne pouvez pas ou ne voulez pas supprimer le contenu en double.
L'application d'une redirection 301 à une URL dirigera Google vers la page que vous avez choisie. Ce sera alors cette page que le moteur de recherche indexera. Cela pourrait être une solution utile au problème du chevauchement des pages de catégories de produits.
Tout ce que vous auriez à faire est d'identifier laquelle des catégories est la plus précieuse pour vous du point de vue du trafic Web. Vous pouvez ensuite utiliser des redirections 301 vers les autres pages en double ou qui se chevauchent vers cette catégorie.
Balises sans index
Une balise Noindex est une directive qui peut être ajoutée au code source HTML d'une page. Il indique explicitement à Google que vous ne souhaitez pas que la page soit indexée. Cela peut empêcher Google de filtrer une page que vous souhaitez indexer en faveur d'une page que vous ne souhaitez pas.
Les balises Noindex sont la meilleure solution pour les problèmes causés par les pages imprimables. Vous devez appliquer une balise Noindex à chacune de ces pages. Cela garantira que la version originale de chaque page sera celle indexée par Google.
Réécrire le contenu
Parfois, les problèmes de contenu en double n'ont tout simplement pas de solution rapide. C'est le cas si votre problème concerne les articles de blog ou les descriptions de produits. S'ils ont créé du contenu en double, vous devez trouver la copie incriminée et la réécrire. Cette solution est chronophage et laborieuse. Il n'y a tout simplement pas d'autre moyen de traiter efficacement le problème.
Une façon d'économiser un peu de temps et d'efforts consiste à utiliser un outil en ligne gratuit comme Copyscape. Copyscape est conçu pour vous aider à écrire du contenu qui n'est pas plagié. Vous pouvez insérer une URL dans le site et il recherchera sur le Web du contenu en double. Cela vous permet de trouver les éléments exacts de votre contenu que vous devrez couper, remplacer ou réécrire.

Nick Brown est le fondateur et PDG d'accelerate agency, une agence de référencement SaaS. Nick a lancé plusieurs entreprises en ligne prospères, écrit pour Forbes, publié un livre et est passé d'une agence britannique à une entreprise qui opère désormais aux États-Unis, en APAC et dans la région EMEA et emploie 160 personnes. Il a également été une fois accusé par un gorille de montagne