Contenu dupliqué et SEO : que vérifie Google ?

Publié: 2022-05-10

Le contenu dupliqué et le référencement sont un mauvais mélange.

Si vous ne voulez pas lancer de campagnes SEO carrément apocalyptiques, alors vous devez absolument éviter les contenus dupliqués.

Au lieu de cela, concentrez-vous sur la création de contenus uniques, riches en valeur et optimisés pour les lecteurs et les moteurs de recherche.

Pour vous aider à éviter les effets dévastateurs de la publication de contenu dupliqué, nous allons approfondir ce qu'est le contenu dupliqué, comment il affecte le référencement et ce que vous pouvez faire pour l'éviter.

Qu'est-ce que le contenu dupliqué en SEO ?

Qu'est-ce que le contenu dupliqué en SEO ?

Plus vous en savez sur le contenu dupliqué, plus il est facile de l'éviter.

Selon Google, le contenu dupliqué est défini comme des "blocs de contenu substantiels" qui correspondent exactement ou partiellement au contenu trouvé ailleurs.

Le contenu en double peut être détecté sur le même site Web ou publié dans différents domaines. Tout site Web qui publie du contenu peut avoir des problèmes de contenu en double.

Que les propriétaires de sites aient des rédacteurs internes ou qu'ils travaillent avec des contributeurs de contenu tiers, dans de nombreuses situations, les sites Web génèrent involontairement du contenu en double :

  • Pages de produits et de catégories : certains sites Web de commerce électronique utilisent des modèles similaires pour les pages de produits et de catégories. Ces modèles peuvent contenir des morceaux des mêmes informations, telles que des descriptions de catégories et des instructions de paiement.
  • Sites de staging : bien que rares, les sites de staging dépourvus de la balise « noindex » pour quelque raison que ce soit peuvent être considérés comme du contenu en double. Les sites de développement sont des copies expérimentales de sites Web utilisés pour prévisualiser et tester de nouvelles fonctionnalités et modifications avant leur mise en ligne.
  • Pages avec des versions « imprimables » : certains sites Web créent des versions « imprimables » des pages pour les utilisateurs qui souhaitent mettre leurs recherches hors ligne. Bien que ces versions soient considérées comme du contenu en double, elles n'ont normalement aucun effet négatif sur le référencement.
  • Modèles de sites Web génériques : les nouveaux sites Web qui ne voient jamais de personnalisations lourdes peuvent utiliser des modèles pour les systèmes de gestion de contenu chargés de texte pré-généré. Certains exemples sont des sites Web alimentés par WordPress qui utilisent des thèmes avec un contenu par défaut pour les pages à l'emporte-pièce, comme les pages de contact, les pages "À propos", etc.
  • Plusieurs URL pointant vers la même page : Google peut détecter des pages en double pour du contenu accessible avec plusieurs URL. Par exemple, une page de destination est accessible à l'aide d'URL avec HTTP ou HTTPS, ainsi que d'URL avec ou sans "www".

Ce sont quelques-uns des nombreux exemples où du contenu dupliqué est créé involontairement. Vous êtes surpris de voir à quel point il est facile d'obtenir du contenu dupliqué ? La bonne nouvelle est que tous ne sont pas mauvais.

Google impose-t-il une pénalité pour contenu dupliqué ?

La réponse courte est oui : Google ajuste le classement et l'indexation des sites reconnus coupables d'avoir du contenu dupliqué. Cependant, cela se produit UNIQUEMENT si le contenu est délibérément copié pour manipuler les classements ou induire les utilisateurs en erreur.

Certains types de contenu en double ne sont pas créés dans l'intention de manipuler les classements de recherche, comme les sites de mise en scène et les copies de description de produit.

Google le sait déjà, c'est pourquoi ils n'appliquent pas automatiquement les pénalités de contenu en double sur chaque site Web qui en contient.

Pourquoi Google se soucie-t-il du contenu dupliqué ?

Premièrement, le contenu dupliqué peut empêcher les publications/contenus d'origine d'être crédités du classement qu'ils méritent. Et, dans certains cas, les utilisateurs peuvent découvrir le même contenu apparaissant plusieurs fois dans les résultats de recherche.

Cela compromet l'expérience utilisateur et est malsain pour le moteur de recherche dans son ensemble.

De plus, ne pas contrôler le contenu en double peut entraîner une vague de sites Web frauduleux ou imitateurs qui prospèrent en téléchargeant à nouveau le contenu existant.

Gardez à l'esprit que les utilisateurs peuvent percevoir un site Web qui a copié plusieurs publications faisant autorité comme digne de confiance. Cela permet essentiellement aux acteurs malveillants de profiter de l'offre inépuisable de contenu en ligne pour profiter de pratiques louches, sans investir eux-mêmes dans la création de contenu.

Quels types de contenu en double peuvent entraîner une pénalité Google ?

Inquiet de la possibilité de pénalités de contenu dupliqué ?

Statistiquement parlant, la plupart des propriétaires de sites Web n'ont pas à y penser.

Le contenu dupliqué est étonnamment courant. C'est en fait un fait bien connu qu'environ 25 à 30% du Web est du contenu dupliqué.

Mais comme une pénalité de Google peut à elle seule tuer une entreprise en ligne, on ne peut jamais être trop en sécurité. Utilisez Google Search Console pour savoir si vous avez reçu une pénalité et suivez les étapes pour l'atténuer.

Voici les types de contenu dupliqué qui peuvent avoir un impact négatif sur le SEO :

1. Contenu dupliqué créé par les rédacteurs de contenu

Tous les écrivains ne sont pas créés égaux.

Il y a ceux qui copient et collent le contenu d'autres sites (tousse - plagie - tousse - si dangereux - tousse).

Alors que d'autres s'efforcent de mener des recherches approfondies et d'écrire de manière magistrale pour s'assurer qu'ils ne produisent que du contenu épique.

C'est pourquoi vous devez travailler avec des rédacteurs ou des équipes indépendants approuvés.

Ce faisant, vous collaborez avec des rédacteurs professionnels dédiés qui ne copieront pas et ne colleront pas de contenu provenant d'autres sources.

De plus, ce sont les types d'écrivains qui savent écrire des titres accrocheurs, intégrer des éléments induisant la conversion dans leurs rédactions et apporter des résultats significatifs aux campagnes de marketing de contenu.

D'un autre côté, les entreprises qui finissent par publier du contenu en double parce que leurs rédacteurs copient et collent du contenu font face à des risques énormes.

En plus des pénalités potentielles de Google, ils pourraient faire face à des poursuites qui pourraient nuire à leur réputation de manière irréparable.

Mettez une prime à votre processus d'embauche. Examinez soigneusement vos rédacteurs ou choisissez une agence qui a fait ses preuves dans la production de contenu unique et riche en valeur. Cliquez pour tweeter

2. Contenu syndiqué mal configuré

Avant toute chose, il convient de mentionner que la syndication de contenu est une stratégie marketing légitime que même les professionnels du marketing utilisent.

La syndication de contenu est le processus de republication d'un article existant sur un autre site Web ou une autre plate-forme. Voici quelques exemples de sites Web de syndication de contenu :

  • Moyen
  • LinkedIn
  • SlideShare
  • Quora

Les propriétaires de sites Web utilisent délibérément la syndication de contenu pour atteindre un public plus large avec leur contenu. Bien qu'il soit techniquement qualifié de contenu dupliqué sur différents domaines, ce n'est généralement pas un problème.

À moins que le site qui a syndiqué votre contenu n'inclue pas de lien retour approprié.

Sans lien, les moteurs de recherche ne sauraient pas quelle version est l'original. En conséquence, le contenu syndiqué peut finir par surclasser votre site, si Google ne vous frappe pas d'abord avec une pénalité.

3. Contenu scrapé

Au fur et à mesure qu'un site Web gagne en popularité, il peut être confronté à une quantité croissante de contenu dupliqué en raison des grattoirs de contenu.

En termes simples, les scrapers de contenu font référence à des logiciels conçus pour télécharger en masse du contenu à partir de sites Web, avec ou sans l'autorisation du propriétaire. Il est très différent des autres scrapers Web qui ne sont destinés qu'à extraire des données spécifiques, telles que des mots clés et diverses mesures.

Les spécialistes du marketing Black Hat utilisent des grattoirs pour voler du contenu à diverses fins, comme le spam et le vol de contenu direct. Quel que soit cet objectif, le scraping de contenu illégal peut entraîner des problèmes de contenu en double pour la source d'origine.

Comment éviter le contenu dupliqué ?

Les risques de pénalités Google pour contenu dupliqué peuvent être faibles, mais ils sont considérables.

Le contenu dupliqué peut entraîner une baisse du classement d'un site Web si Google détecte une intention malveillante. Dans quelques cas, un site Web est complètement mis sur liste noire à cause de son apparition dans les résultats des moteurs de recherche.

Heureusement, il existe plusieurs moyens éprouvés d'éviter les problèmes de contenu dupliqué :

1. Syndiquez avec soin

Si la syndication de contenu est un élément crucial de votre stratégie de marketing de contenu, faites-le avec un soin particulier.

Assurez-vous que le contenu syndiqué contient un lien avec une balise "canonique" vers le contenu d'origine (également appelé URL canonique).

Les sites Web de syndication de contenu de confiance le font par défaut. Mais pour faire bonne mesure, contactez et vérifiez qu'il y a une balise canonique sur chacun de vos articles.

Syndiquez avec soin

Conseil de pro : utilisez un outil de contenu en double comme Ahrefs pour trouver du contenu en double en interne sur votre site ou sur différents sites.

2. Utilisez la balise "noindex" sur les archives et les pages de catégories

Si Google classe les pages d'archives ou de catégories sur votre contenu, vous pouvez bloquer l'indexation de ces pages à l'aide de la balise noindex.

Tout ce que vous avez à faire est de coller une simple balise méta dans la section "<head>" de votre page ou de votre message.

Pour empêcher tous les robots des moteurs de recherche d'indexer une page, utilisez :

  • <meta name=”robots” content=”noindex”>

Si vous souhaitez uniquement empêcher Google d'indexer une page spécifique, utilisez :

  • <meta name=”googlebot” content=”noindex”>

empêcher Google d'indexer une page spécifique

(Source de l'image : Developers.Google.com)

3. Vérifiez le mauvais contenu en double

Il existe des dizaines d'outils qui peuvent analyser automatiquement votre site Web à la recherche de mauvais contenu en double. Un bon exemple serait Ahrefs, qui peut vérifier les sites Web pour les mauvais doublons via l'outil d'audit de site.

Outil d'audit de site (Source de l'image : Ahrefs.com)

Vous pouvez également utiliser Duplicate Content Checker by SEO Review Tools pour rechercher des doublons internes et externes sur votre site Web.

Vérificateur de contenu en double par les outils de révision SEO

(Source de l'image : SEOReviewTools.com)

Le contenu dupliqué interne fait référence au contenu répété sur votre site Web. Les doublons externes, en revanche, font référence au contenu dupliqué sur différents sites.

L'utilisation d'outils permet de repérer facilement le contenu en double involontaire qui peut nuire au profil SEO de votre site Web.

Si vous trouvez du contenu en double, voici ce que vous pouvez faire pour les corriger :

  • Désignez le contenu original avec une balise canonique
  • Utilisez la balise "noindex" sur les doublons
  • Supprimer le contenu dupliqué

4. Utilisez des vérificateurs de plagiat

Pour les marques qui s'approvisionnent en contenu auprès de sous-traitants, un outil comme Copyscape garantit que vous publiez du contenu 100 % original.

Copyscape est un vérificateur de plagiat éprouvé qui peut vérifier instantanément si un article contient ou non des informations en double. C'est un incontournable dans la boîte à outils de chaque agence de marketing de contenu.

Copyscape

(Source de l'image : Copyscape.com)

Outre les contrôles de plagiat à la demande, Copyscape propose également "Copysentry". Pour aussi peu que 4,95 $ par mois, l'outil vérifiera sur le Web des copies de jusqu'à 10 pages sur une base hebdomadaire.

Chaque fois que quelqu'un vole votre contenu et le publie ailleurs, Copyscape enverra une alerte par e-mail pour que vous puissiez agir. Vous pouvez demander de supprimer le contenu en double, demander un lien canonique ou déposer un retrait DMCA via la section d'aide juridique de Google.

5. Combinez des pages similaires

Parfois, les pages qui traitent du même sujet contiennent des informations similaires qui peuvent être considérées comme des doublons.

Par exemple, vous pourriez avoir un listicule avec des éléments qui se chevauchent et qui ont des descriptions de produits presque identiques. Vous pouvez également avoir des pages de destination similaires ciblant différentes villes, qui peuvent contenir des tas de texte en double.

Dans les deux scénarios, une solution simple consiste à regrouper les informations dans un seul message.

Les propriétaires de sites Web doivent également éviter d'utiliser des modèles de page génériques, sauf s'ils prévoient d'effectuer de lourdes personnalisations. Cela minimise les risques de créer involontairement du contenu en double qui peut dérouter les lecteurs ainsi que les robots des moteurs de recherche.

6. Soyez cohérent avec les liens internes

Lorsque vous créez des liens internes vers des pages spécifiques, assurez-vous d'utiliser la même URL à chaque fois.

Ne créez pas de lien vers "http://votresite.com/blog/votre-post/" dans un article et "https://www.votresite.com/blog/votre-post/" dans un autre. L'utilisation d'une seule URL pour plusieurs liens internes indique que vous créez un lien vers la page canonique.

FAQ sur la duplication de contenu

Questions fréquemment posées

1. Qu'est-ce que Google considère comme contenu dupliqué ?

Google définit le contenu dupliqué comme des blocs de contenu qui contiennent des informations similaires ou "sensiblement similaires" au contenu existant. Changer quelques mots avec des synonymes ou même paraphraser des paragraphes entiers ne suffit pas pour masquer le contenu en double à Google.

2. Est-il acceptable de copier les descriptions de produits ?

Les descriptions de produits en double n'affectent en rien le référencement. Tant que vous n'induisez pas les lecteurs en erreur, n'hésitez pas à utiliser des descriptions de produits copiées-collées là où elles ont du sens.

3. Quelle est la solution la plus courante pour le contenu dupliqué ?

L'utilisation de la balise rel=canonical résout de nombreux problèmes de contenu dupliqué, des paramètres d'URL dynamiques à la syndication de contenu. C'est une solution universelle qui indique à Google comment trouver le contenu original.

Évitez le contenu dupliqué tout en dominant votre secteur

Avec les conseils ci-dessus, vous pouvez éviter de publier du contenu en double et de subir ses effets dévastateurs.

Si vous souhaitez une stratégie de marketing de contenu exempte de contenu dupliqué et susceptible de générer des revenus et une croissance commerciale, planifiez un appel avec nous dès maintenant.

Nos Success Managers peuvent constituer (et gérer) une équipe de producteurs, éditeurs et rédacteurs chevronnés pour répondre à tous vos besoins en matière de contenu.