Come risolvere i problemi con i contenuti duplicati sul tuo sito web

Pubblicato: 2019-06-11

Il contenuto duplicato è una delle principali preoccupazioni SEO. È lassù con link ingannevoli ed evitare sanzioni di Google. Avere contenuti duplicati può essere dannoso per il traffico organico di qualsiasi sito. Tutti coloro che si occupano di SEO lo capiscono. Ciò non significa che il contenuto duplicato sia facile da evitare. Nonostante i tuoi migliori sforzi, il tuo sito potrebbe ancora soffrire di problemi con contenuti duplicati.

Questa guida è progettata per aiutarti a risolvere questi problemi. Ti indicheremo i modi principali in cui possono verificarsi contenuti duplicati. Entreremo quindi nel nocciolo di ciò che puoi fare per evitare e risolvere problemi di contenuti duplicati. Prima, però, vale la pena spiegare cos'è il contenuto duplicato e perché è importante.

Prenota una consulenza

Contenuti duplicati e Google

Il modo migliore per spiegare cos'è il contenuto duplicato è guardare come lo definiscono gli stessi Google. Nelle loro linee guida di supporto relative ai contenuti duplicati, offrono la seguente definizione:

"Blocchi sostanziali di contenuti all'interno o tra domini che corrispondono completamente ad altri contenuti o sono notevolmente simili".

È abbastanza semplice perché è importante il contenuto duplicato. Ciò è dovuto al modo in cui influisce su ciò che Google mira a fornire ai propri utenti. Il motore di ricerca si sforza di indicizzare e visualizzare pagine con informazioni distinte. Questo fa parte del loro costante desiderio di garantire una migliore esperienza utente.

Le pagine con contenuti duplicati non si qualificano come aventi informazioni distinte. Pertanto, Google filtrerà quelle pagine duplicate. Ciò significa che verrà elencata solo una delle pagine con contenuti duplicati. Ciò può avere un profondo effetto negativo sul traffico organico di un dominio. Le pagine che altrimenti attirerebbero più traffico verso un sito non verranno affatto elencate.

È un'idea sbagliata comune che Google imponga sanzioni per i contenuti duplicati. Non è così, ma se sospettano un uso dannoso di contenuti duplicati agiranno. Sarebbe quando il contenuto viene utilizzato per manipolare le loro classifiche. In tal caso essi:

'Apportare le opportune modifiche all'indicizzazione e al ranking dei siti coinvolti. Di conseguenza, il posizionamento del sito potrebbe risentirne o il sito potrebbe essere completamente rimosso dall'indice di Google. In tal caso non apparirà più nei risultati di ricerca.'

Ormai dovrebbe essere ovvio che vuoi evitare contenuti duplicati sul tuo sito. Anche se stai attento a farlo, può comunque verificarsi. Ci sono molti modi in cui questo può accadere.

Come possono verificarsi contenuti duplicati

Come abbiamo già accennato, i contenuti duplicati possono essere deliberatamente presenti su un dominio. Di solito come un modo per cercare di ingannare o manipolare le classifiche di Google. Ogni professionista SEO ora sa quanto siano intelligenti gli algoritmi di Google. Solo il più sciocco o indifferente di loro penserebbe di poter farla franca con tale manipolazione.

È molto più frequente che i contenuti duplicati su un sito si siano sviluppati in modo naturale. Ciò sarà dovuto a determinati problemi tecnici o al semplice errore umano. È importante capire i modi principali in cui ciò può accadere. Ti aiuterà a identificare i tuoi problemi di contenuti duplicati. Sarà anche più facile scegliere la migliore soluzione possibile.

Le cause dei contenuti duplicati di cui parleremo sono le seguenti:

  • Parametri URL per il filtraggio e il tracciamento
  • Incrocio della pagina della categoria di prodotto
  • Descrizioni dei prodotti duplicate
  • Problemi tecnici con gli URL
  • Pagine stampabili
  • Problemi di creazione dei contenuti

Parametri URL per il filtraggio e il monitoraggio

I parametri URL sono come suffissi aggiunti alla fine dell'URL di una pagina. Si verificano in molte situazioni e spesso non cambiano molto o addirittura non modificano affatto il contenuto di una pagina. Il problema è che per un motore di ricerca un URL con un parametro diverso alla fine è un URL diverso. Se il contenuto collegato dai "due" URL è lo stesso, Google lo identificherà come contenuto duplicato.

Un ottimo esempio di ciò deriva dal filtraggio dei prodotti sui siti di e-commerce. Quasi tutti questi tipi di siti consentono ai clienti di filtrare i prodotti. Potrebbero voler mostrare solo i prodotti all'interno di una certa fascia di prezzo o realizzati con un particolare materiale. L'atto di filtrare i prodotti aggiunge un parametro URL all'URL. Tuttavia, il contenuto mostrato - i prodotti ecc. - verrà duplicato altrove.

Un altro esempio è nel caso del tracciamento. I parametri di monitoraggio ti consentono di monitorare le fonti dei visitatori del tuo sito. Questo può essere cruciale per monitorare il ROI di diversi sforzi SEO. Potrebbero assomigliare a questo: '/?source=rss'. Non hanno alcun impatto sul contenuto di una pagina, ma guardano anche a un motore di ricerca come un URL univoco.

Prodotto Categoria Pagina Crossover

Anche un problema particolare dei siti di e-commerce è quello del crossover delle pagine di categoria. Molti siti avranno pagine di categorie diverse che mostrano principalmente gli stessi prodotti. Questo viene spesso fatto per ragioni ben intenzionate e comprensibili.

Ad esempio, un sito di regali potrebbe avere categorie denominate "Regali per lui" e "Regali per la festa del papà". Le due categorie possono attrarre clienti diversi. I prodotti visualizzati nelle pagine delle categorie, tuttavia, saranno quasi identici. Questo è tutto ciò che conta per Google e potrebbero indicizzare solo una delle pagine.

Duplicazione delle descrizioni dei prodotti

Un livello in basso sui siti di e-commerce rispetto alle pagine delle categorie sono le pagine dei prodotti. Questi possono anche essere una fonte comune di problemi di contenuti duplicati. I visitatori di tali pagine si aspetteranno che ci sia una breve descrizione del prodotto. Sarà il modo in cui le caratteristiche e le caratteristiche del prodotto vengono vendute ai clienti.

I siti che vendono molti prodotti spesso non creano descrizioni univoche per ciascuno di essi. Molte aziende si limitano a copiare e incollare informazioni generiche. Spesso è stato fornito da un fornitore o da un produttore. Ciò porta a un sacco di contenuti duplicati all'interno e tra domini diversi.

I maggiori problemi in questo caso saranno se il tuo sito vende gli stessi prodotti di un rivenditore molto più grande come Amazon. Le descrizioni copiate potrebbero portare la pagina del tuo prodotto a contenuti duplicati trovati su Amazon. Google indicizzerà sicuramente la pagina di Amazon piuttosto che la tua.

Problemi tecnici con gli URL

Oltre ai parametri URL, ci sono un paio di altri problemi tecnici relativi agli URL che possono portare a problemi di contenuti duplicati. Il primo si presenta sotto forma di "ID di sessione". Questi vengono utilizzati negli URL quando ai visitatori del sito viene assegnata una "sessione". Spesso è così che possono aggiungere articoli a un carrello della spesa e farli rimanere lì.

Gli ID di sessione vengono aggiunti a ogni collegamento interno mentre un visitatore visita il tuo sito. Ciò crea molti URL che un motore di ricerca può visualizzare come contenuto duplicato. Allo stesso modo, gli URL disordinati come parte di un CMS possono avere un effetto simile. Gli URL con parametri per categoria e articolo che cambiano l'ordine sono ottimi esempi.

Pagine stampabili

Il tuo CMS potrebbe creare pagine stampabili. Queste pagine saranno collegate al tuo sito dalle pagine degli articoli e altrove. Google sarà in grado di trovare queste pagine a meno che tu non le interrompa specificamente (ne parleremo più avanti).

Google filtrerà e indicizzerà solo una delle pagine duplicate. Potrebbe essere l'originale o la versione stampabile. Vuoi che la tua pagina originale si classifichi, non quella adatta alla stampa. Quest'ultimo non avrà tutti i tuoi annunci, link e altri contenuti.

Problemi di creazione di contenuti

La maggior parte di quanto sopra sono cause tecniche di problemi di contenuti duplicati. Dove entra in gioco l'errore umano è nell'area della creazione di contenuti. Quasi ogni sito in questi giorni ha un blog o una risorsa informativa simile. Li aiuta a fornire informazioni utili ai visitatori. I blog possono spesso ospitare molti contenuti duplicati.

Ciò potrebbe essere dovuto all'aver affidato la creazione di contenuti a qualcuno che non dovresti. Qualcuno che non capisce i problemi che i contenuti duplicati possono causare. Potrebbero copiare o ricreare contenuti senza conoscere i problemi SEO che stanno creando. I loro errori potrebbero essere piccoli come usare sempre gli stessi tag del titolo. Potrebbero essere grandi quanto copiare direttamente il contenuto da altri siti.

Risoluzione dei problemi con contenuti duplicati

Ora dovresti avere un'idea dell'origine dei tuoi problemi con i contenuti duplicati. Quanto sopra sono tutte cause di quei problemi che sono comuni a molti siti. Capirli e sapere quali hanno influenzato il tuo sito è fondamentale. Questo perché le diverse cause si prestano a diverse soluzioni.

Esamineremo alcuni dei modi migliori per risolvere i problemi con i contenuti duplicati. Indicheremo quali dei problemi e delle cause che abbiamo già menzionato si adattano meglio a ciascuna soluzione man mano che procediamo. Le nostre soluzioni rientrano in due categorie:

  • Soluzioni educative e preventive
  • Soluzioni pratiche e sforzi di recupero

Soluzioni educative e preventive

In un mondo ideale, vuoi evitare problemi con contenuti duplicati prima che si presentino. Conoscere le cause dei problemi che abbiamo discusso è un ottimo punto di partenza. Avere questa conoscenza può aiutarti ad adottare misure per garantire che nessun nuovo contenuto cada negli stessi problemi.

Puoi, ad esempio, disabilitare gli ID di sessione nelle impostazioni di sistema. Ciò eviterà i problemi di URL duplicati che possono causare. Puoi scegliere di rinunciare del tutto a includere pagine stampabili sul tuo sito web. Non è che molte persone abbiano motivo di stampare pagine al giorno d'oggi comunque. Una campagna di tracciamento basata su hashtag può anche essere una buona alternativa al tracciamento basato su parametri.

Avendo appreso le cause dei contenuti duplicati, sei in grado di educare gli altri. Possono includere sviluppatori Web o il tuo team di prodotto. Puoi spiegare loro i problemi relativi al crossover nelle categorie di prodotti. In questo modo sapranno organizzare i prodotti di conseguenza. I creatori di contenuti freelance o interni possono anche essere informati su come mantenere le cose uniche.

Cioè in un mondo ideale. In realtà, potresti non essere in grado di anticipare tutti i tuoi problemi di contenuti duplicati. In quelle circostanze hai bisogno di alcune soluzioni pratiche. Saranno ciò che può aiutarti a riprenderti dai problemi di cui già soffri.

Soluzioni pratiche e sforzi di recupero

La nostra guida finora dovrebbe averti mostrato da dove potrebbero provenire i tuoi problemi di contenuto duplicato. Ora abbiamo anche offerto alcuni suggerimenti per evitare che si verifichino altri problemi. Ciò che resta è suggerire alcune linee d'azione se il tuo sito ha già problemi con contenuti duplicati. Ci sono molte diverse opzioni a tua disposizione.

URL canonici

Gli URL canonici possono aiutarti se il tuo problema riguarda URL diversi che portano allo stesso contenuto. Come nel caso dei parametri di filtraggio o delle pagine di categoria, come descritto in precedenza. Un URL canonico è l'URL "corretto". È l'URL della pagina che desideri che Google indicizzi tra quelle che portano allo stesso contenuto. Devi decidere in ogni caso quale pagina sia.

Una volta identificato, è semplice dire a Google quale pagina è il tuo URL canonico. Tutto quello che devi fare è aggiungere un elemento HTML alla sezione <head> delle altre pagine. Chiamato "elemento di collegamento canonico", ha questo aspetto; 'rel=canonico'. Indirizzerà Google alla pagina scelta quando sarà seguito dal suo URL.

Reindirizzamenti 301

L'indirizzamento di Google a URL canonici è talvolta descritto come l'utilizzo di "reindirizzamenti soft". Questo è l'opposto dei reindirizzamenti 301 a tutti gli effetti. Puoi anche usarli se non puoi o non vuoi rimuovere i contenuti duplicati.

L'applicazione di un reindirizzamento 301 a un URL indirizzerà Google verso la pagina scelta. Sarà quindi quella pagina che il motore di ricerca indicizza. Questa potrebbe essere una soluzione utile al problema della sovrapposizione delle pagine delle categorie di prodotti.

Tutto quello che dovresti fare è identificare quale delle categorie è più preziosa per te dal punto di vista del traffico web. È quindi possibile utilizzare i reindirizzamenti 301 dalle altre pagine duplicate o sovrapposte a quella categoria.

Tag senza indice

Un tag Noindex è una direttiva che può essere aggiunta al codice sorgente HTML di una pagina. Dice esplicitamente a Google che non desideri che la pagina venga indicizzata. Ciò può impedire a Google di filtrare una pagina che desideri indicizzare a favore di una che non desideri.

I tag Noindex sono la soluzione migliore per i problemi causati dalle pagine stampabili. Dovresti applicare un tag Noindex a ciascuna di queste pagine. Ciò garantirà che la versione originale di ogni pagina sia quella che Google indicizza.

Riscrittura del contenuto

A volte i problemi di contenuti duplicati non hanno una soluzione rapida. Questo è il caso se il tuo problema riguarda i post del blog o le descrizioni dei prodotti. Se hanno creato contenuti duplicati, devi trovare la copia incriminata e riscriverla. Questa soluzione richiede molto tempo e lavoro. Non c'è altro modo per affrontare abilmente il problema.

Un modo per risparmiare tempo e fatica è utilizzare uno strumento online gratuito come Copyscape. Copyscape è progettato per aiutarti a scrivere contenuti non plagiati. Puoi inserire un URL nel sito e cercherà sul web i contenuti duplicati. Ciò ti consente di trovare gli elementi esatti dei tuoi contenuti che dovrai tagliare, sostituire o riscrivere.