Contenu dupliqué et SEO : le guide complet

Publié: 2022-09-11

Imaginez mettre le contenu de votre site Web sur un autre site Web ! Peu importe si le contenu dupliqué sur votre site Web y a été placé par erreur ou si quelqu'un a volé des blocs de contenu sur votre site. Vous devez agir rapidement pour corriger la situation.

Peu importe que vous soyez à la tête d'une petite entreprise ou d'une multinationale géante ; le contenu en double est un danger pour tout effort de site Web convivial pour le référencement.

Voyons comment repérer le contenu en double et déterminer s'il affecte les performances de votre site Web en interne ou entre les domaines.

Qu'est-ce que le contenu dupliqué ?

Duplicate Content
Contenu dupliqué

Le contenu qui est similaire ou des copies exactes du contenu d'autres sites Web ou de plusieurs pages du même site Web est appelé contenu dupliqué. Avoir beaucoup de contenu en double sur votre site Web peut nuire à votre classement Google.

Pour le dire autrement :

Le contenu dupliqué est un contenu qui est mot pour mot identique au contenu d'une autre page. Cependant, "Duplicate Stuff" inclut du contenu similaire à d'autres contenus… même s'il est légèrement réécrit.

Quelle est la relation entre le contenu dupliqué et le référencement ?

Google n'impose aucune sanction en cas de duplication de contenu. Cependant, comme les principaux moteurs de recherche filtrent un contenu identique, vos visiteurs peuvent être détournés, ce qui entraîne une pénalité. En conséquence, le classement du site Web en souffrira. Le contenu dupliqué est la source de la confusion de Google, car il oblige le moteur de recherche à choisir entre des pages identiques à des fins de classement.

Peu importe qui a créé le contenu original, car il est possible que le contenu original ne soit pas choisi pour être classé dans les SERP. L'une des nombreuses raisons pour lesquelles le contenu dupliqué est l'une des erreurs de référencement à éviter est à cause de cela.

Envisagez de faire appel à un spécialiste du référencement pour vous aider dans cette tâche. Le contenu dupliqué ne sera plus un problème et les services de référencement seront plutôt peu coûteux.

Quels sont les éléments importants de la page ?

Pour éviter les problèmes de contenu en double, assurez-vous que chacune des pages de votre site Web possède sa propre méta description et son propre titre de page dans le code HTML. Les titres tels que h1, h2 et h3 doivent être différents de ceux des autres pages du site.

Bien que la méta description, le titre et les en-têtes ne constituent qu'une petite partie du contenu de votre site Web, il est préférable de rester aussi loin que possible de la zone grise du contenu dupliqué. C'est un excellent moyen d'amener les moteurs de recherche à examiner la valeur des méta-descriptions sur votre site Web.

Quel est l'impact du contenu dupliqué sur le référencement ?

Google ne souhaite pas classer les pages qui ont un contenu dupliqué.

En réalité, selon Google :

"Google s'efforce d'indexer et d'afficher des pages contenant des informations uniques."

Par conséquent, le fait d'avoir des pages sur votre site dépourvues d'informations distinctes nuira aux résultats de votre moteur de recherche. Voici les trois problèmes les plus courants auxquels sont confrontés les sites avec beaucoup de contenu dupliqué.

Moins de trafic organique :

C'est plutôt explicite. Google ne souhaite pas que les pages dont le contenu est copié à partir d'autres pages de son index soient classées. (Cela peut inclure des pages de votre propre site Web.)

Imaginons que vous ayez trois pages sur votre site qui ont toutes un contenu comparable.

Less Organic Traffic
Moins de trafic organique

Google ne sait pas si l'une des deux pages est "l'original". En conséquence, les trois pages auront du mal à se classer.

Duplicate pages will all struggle to rank
Les pages en double auront toutes du mal à se classer

Pénalité (extrêmement rare) :

Selon Google, le contenu dupliqué peut entraîner une pénalité ou la désindexation complète d'un site Web.

Penalty
Peine

Ceci est cependant assez rare. Et cela n'est fait que lorsqu'un site Web récupère ou duplique délibérément le contenu d'autres sites Web.

duplicate content penalty
pénalité de contenu dupliqué

Ainsi, vous n'avez généralement pas à vous soucier d'une "pénalité de contenu en double" si votre site contient de nombreuses pages en double.

Moins de pages indexées :

Ceci est particulièrement critique pour les sites Web comportant un grand nombre de pages (comme les sites de commerce électronique).

Fewer Indexed Pages
Moins de pages indexées

Le contenu dupliqué n'est pas toujours déclassé par Google. Il ne l'indexera pas du tout.

Si les pages de votre site ne sont pas indexées, il est possible que votre budget de crawl soit gaspillé sur du contenu dupliqué.

Les meilleures pratiques

Surveillez le même contenu sur différentes URL

Il s'agit de la cause la plus courante des problèmes de contenu dupliqué.

Imaginons que vous êtes propriétaire d'une boutique en ligne.

Vous proposez également des t-shirts sur votre page produit.

example product page
exemple de page produit

Si tout est mis en place correctement, ce t-shirt sera disponible dans toutes les tailles et couleurs à la même URL.

Product with all variations
Produit avec toutes les variantes

Cependant, vous constaterez peut-être que votre site génère une nouvelle URL pour chaque nouvelle version de votre produit… Cela conduit à des MILLIERS de pages avec un contenu dupliqué.

Vérifier les pages indexées

L'examen du nombre de pages de votre site indexées dans Google est l'un des moyens les plus simples de repérer le contenu en double.

Vous pouvez le faire en allant sur Google et en tapant site:example.com.

Check Indexed Pages
Vérifier les pages indexées

Vous pouvez également accéder à la console de recherche Google et consulter vos pages indexées.

Assurez-vous que votre site redirige correctement

Vous n'avez pas toujours plusieurs versions d'une même page… parfois vous avez différentes versions d'un même SITE.

Bien que rare, j'en ai été témoin à plusieurs reprises dans la nature.

Ce problème survient lorsque la version « WWW » de votre site Web ne redirige pas vers la version « non-WWW ».

Cela peut également se produire si vous n'avez pas redirigé le site HTTP après être passé à HTTPS.

En d'autres termes, toutes les versions multiples de votre site doivent se retrouver au même endroit.

Make Sure Your Site Redirects Correctly
Assurez-vous que votre site redirige correctement

Utiliser les redirections 301

Le moyen le plus simple de résoudre les problèmes de contenu dupliqué sur votre site consiste à utiliser les redirections 301. Si vous découvrez une multitude de pages de contenu en double sur votre site, redirigez-les simplement vers l'original. Lorsque Googlebot vient visiter, il évaluera la redirection et indexera UNIQUEMENT le contenu original.

Gardez un œil sur le contenu similaire

Un contenu dupliqué n'implique pas toujours un contenu qui a été dupliqué mot pour mot à partir d'une autre source.

En vérité, Google définit le contenu dupliqué comme suit : vous pouvez toujours avoir des problèmes de contenu dupliqué même si votre contenu est techniquement différent de ce qui existe.

Google - duplicate content
Google – contenu dupliqué

Pour la plupart, ce n'est pas un problème. La majorité des sites Web comptent quelques dizaines de pages. Ils écrivent également un contenu unique pour chaque page. Cependant, un contenu dupliqué "semblable" peut apparaître dans certaines circonstances.

Cela prend-il du temps de créer un contenu 100 % unique pour chaque page de votre site Web ? Ouais. C'est néanmoins nécessaire si vous voulez vraiment classer chaque page de votre site.

Utiliser la balise canonique

Canonical-tag
Balise canonique

Les moteurs de recherche comprennent ce que signifie la balise rel=canonical :

"Oui, il y a un certain nombre de pages sur notre site qui ont du contenu en double. Cependant, CECI est la page d'origine. Le reste peut être ignoré.

Selon Google, l'utilisation d'une balise canonique est préférable au blocage des pages au contenu dupliqué.

Use the Canonical Tag
Utiliser la balise canonique

(Par exemple, utiliser robots.txt ou un élément noindex dans le code HTML de votre page Web pour bloquer Googlebot)

Ainsi, si vous découvrez une multitude de pages en double sur votre site, vous pouvez soit :

  • Retirez-les de l'équation.
  • Ils doivent être redirigés.
  • La balise canonique doit être utilisée.

Utiliser un outil

Il existe quelques outils de référencement qui ont des fonctionnalités pour détecter le contenu dupliqué.

Siteliner Opens in a new tab. , par exemple, recherche sur votre site Web des pages contenant beaucoup de contenu en double.

siteliner
doublure de site

Consolider les pages

Comme je l'ai dit précédemment, si vous avez plusieurs sites avec le même contenu, vous devriez probablement les rediriger vers une seule page.

Mais que se passe-t-il si vous avez des pages avec un contenu similaire ? Vous pouvez cependant créer un contenu unique pour chaque page… OU les combiner en une seule méga-page.

Pages de catégorie ou de balise WordPress Noindex

Si vous utilisez WordPress, vous avez peut-être remarqué que les pages de balises et de catégories sont générées automatiquement. Le contenu dupliqué est abondant sur ces pages.

Je recommande d'ajouter la balise "noindex" à ces pages afin qu'elles soient utiles aux utilisateurs. De cette manière, ils peuvent exister sans être indexés par les moteurs de recherche. Vous pouvez également configurer WordPress pour empêcher la génération de ces pages.

Qu'est-ce que le contenu scrapé ?

Le contenu récupéré se produit lorsqu'un propriétaire de site Web récupère le contenu d'un autre afin d'améliorer la visibilité organique. Ces webmasters essaient de persuader les machines de réécrire le contenu gratté qu'ils ont obtenu d'autres sites Web.

Le contenu scrapé est parfois facile à repérer car les voleurs n'essayent souvent pas de mettre à jour les termes de marque dans le contenu. Si vous êtes surpris en train de tenter de manipuler l'index de recherche Google, votre site Web sera classé beaucoup plus bas ou peut-être entièrement supprimé des résultats de recherche.

Derniers mots

Éviter les duplications par inadvertance est également essentiel car cela pourrait entraîner une pénalité de Google, ce qui affecterait tout votre contenu à la fois.

1) Assurez-vous que chaque mot est écrit plutôt que de simplement copier et coller du texte ou des photos sans rien ajouter de nouveau pour garantir l'originalité.

2) Faites un usage approprié des mots-clés pour que votre contenu reste pertinent.

3) Lorsque cela est possible, utilisez des synonymes.

Les algorithmes de Google sont continuellement mis à jour afin d'identifier et de sanctionner les sites Web spammés.