SEO per contenuti duplicati: come verificare la presenza di contenuti duplicati

Pubblicato: 2022-06-14

I contenuti duplicati possono influire su quale delle tue pagine viene visualizzata nei risultati di ricerca e sprecare il tuo budget di scansione. Fortunatamente, ci sono modi per identificare i contenuti duplicati e rimuoverli dal tuo sito Web o dall'indice di Google per evitare che influiscano negativamente sulla tua capacità di classifica.

Che cos'è il contenuto duplicato?

Il contenuto duplicato si verifica quando lo stesso contenuto viene visualizzato in più di una posizione con un URL univoco.

Non è necessario che i contenuti corrispondano esattamente per essere registrati come duplicati: possono anche essere ciò che Google chiama "apprezzabilmente simili". Questo contenuto è essenzialmente "abbastanza vicino" da essere considerato contenuto duplicato anche se alcuni testi potrebbero differire.

La maggior parte dei proprietari di siti lavora sodo per assicurarsi che i propri contenuti siano freschi e originali, eppure ci sono ancora molti contenuti duplicati sul web. A volte i proprietari di siti non ne sono nemmeno consapevoli. Allora come succede?

Perché si verificano contenuti duplicati?

La maggior parte dei contenuti duplicati sul Web si verifica a causa dell'indicizzazione di elementi come versioni stampabili delle pagine, prodotti che si trovano o sono collegati a diversi URL diversi e forum di discussione che generano versioni desktop e mobili ridotte della stessa pagina .

Ma questi non sono gli unici modi in cui puoi ritrovarti con contenuti duplicati sul tuo sito. Ecco alcuni altri esempi di come i contenuti duplicati possono verificarsi internamente sul tuo sito ed esternamente su altri siti.

Duplicati generati internamente

Pagine di prodotti apprezzabilmente simili

A volte può avere senso creare intenzionalmente pagine sensibilmente simili, soprattutto nell'e-commerce. Ad esempio, supponi di vendere lo stesso prodotto in due paesi diversi. In tal caso, puoi scegliere di avere due pagine quasi identiche, tranne per il fatto che una potrebbe visualizzare il prezzo in dollari statunitensi mentre l'altra lo visualizza in dollari canadesi.

Un altro esempio sono le pagine dei prodotti che appaiono notevolmente simili perché presentano la stessa copia, con le uniche differenze reali che sono una diversa immagine del prodotto, nome del prodotto e prezzo del prodotto.

Sistemi di gestione dei contenuti

A volte i sistemi di gestione dei contenuti creano contenuti duplicati di cui potresti non essere nemmeno a conoscenza. Alcuni sistemi aggiungono automaticamente tag e parametri URL per le ricerche, risultando in più percorsi per lo stesso identico contenuto.

Variazioni URL

Puoi anche ritrovarti con contenuti duplicati se hai diverse varianti di URL che presentano lo stesso contenuto. Come accennato in precedenza, i sistemi di gestione dei contenuti potrebbero farlo da soli e potresti ritrovarti con due varianti di URL come https://www.website.com/blog1 e https://www.website.com/blogs/blog1 . Altre variazioni dell'URL come le barre finali o gli URL in maiuscolo possono causare lo stesso problema.

Quando ciò accade, Google potrebbe non sapere quale pagina classificare e alcune fonti esterne potrebbero collegarsi a una di queste pagine mentre altre si collegano al duplicato, interrompendo l'equità di collegamento della tua pagina nel processo.

HTTP vs HTTPS e www vs non www

La maggior parte dei siti Web è accessibile con o senza www o tramite URL HTTP o HTTPS. Tuttavia, se non hai configurato correttamente il tuo sito, Google potrebbe indicizzare le pagine di più di uno di essi, generando contenuti duplicati.

URL stampabili e ottimizzati per dispositivi mobili

Le pagine stampabili o ottimizzate per dispositivi mobili ospitate su URL diversi rispetto alla pagina originale risulteranno in contenuti duplicati a meno che non siano correttamente non indicizzati.

ID di sessione

Gli ID di sessione possono essere strumenti preziosi per tenere traccia dei visitatori che visitano il tuo sito. Questo viene generalmente fatto aggiungendo una lunga stringa ID di sessione all'URL. Poiché ogni ID sessione è univoco, questo crea un nuovo URL e duplica i tuoi contenuti.

Parametri UTM

I parametri possono tracciare i visitatori in arrivo da varie fonti. Come gli ID di sessione, generano URL univoci sebbene il contenuto della pagina sia lo stesso, creando così contenuti duplicati se indicizzati.

Duplicati generati esternamente

Contenuti sindacati

Sindacare i tuoi contenuti ad altri siti sul Web può essere un ottimo modo per indirizzare più traffico al tuo sito Web e portare il tuo nome là fuori. Tuttavia, questo contenuto può ancora apparire come contenuto duplicato se non formattato con i tag di intestazione canonici appropriati. Ad esempio, l'utilizzo di tag canonici su articoli medi può proteggere il tuo contenuto originale dalla registrazione come duplicato.

Plagio

Sebbene la maggior parte dei contenuti duplicati sia di natura non dannosa, alcuni webmaster copiano deliberatamente i contenuti, cercando di trarre vantaggio da contenuti che non hanno prodotto loro stessi.

SEO per contenuti duplicati: perché è importante?

Se i contenuti duplicati si verificano così frequentemente, perché è importante? Ecco cinque modi in cui può influire sulla tua capacità di posizionarti bene nei risultati di ricerca.

1. Penalità per i contenuti duplicati di Google

Google non penalizza direttamente i contenuti duplicati, il più delle volte. Se Google ritiene che i contenuti duplicati sul tuo sito siano "ingannevoli" e "destinati a manipolare i risultati dei motori di ricerca", potrebbe intervenire applicando una sanzione per i contenuti duplicati. Quindi, anche se non accade spesso, secondo le linee guida sui contenuti duplicati di Google, potresti comunque finire per affrontare una sanzione diretta se i tuoi contenuti duplicati sono abbastanza eclatanti e si ritiene che siano stati creati con intenzioni dannose.

Una sanzione di Google per contenuti duplicati è rara, quindi la preoccupazione più urgente è la relazione tra contenuti duplicati e SEO.

2. Rigonfiamento dell'indice

Il rigonfiamento dell'indice si verifica quando i crawler dei motori di ricerca accedono e indicizzano contenuti non importanti o di bassa qualità, come quelle pagine stampabili che ho menzionato. Ciò influisce sulla tua capacità di classificare le tue pagine importanti poiché i motori di ricerca non sapranno quale versione dei tuoi contenuti suggerire agli utenti e potrebbero classificare una versione diversa da quella che preferiresti. Influisce anche sul crawl budget.

3. Budget di scansione

Google limita il tempo impiegato per eseguire la scansione dei siti. La quantità di risorse che Google fornisce per eseguire la scansione e l'indicizzazione del tuo sito corrisponde al tuo budget di scansione. Quando hai molti contenuti duplicati, rischi di sprecare il tuo budget di scansione su pagine che non sono così importanti.

4. Cannibalizzazione delle parole chiave

Se più di una copia di una pagina è classificata, le tue pagine saranno in competizione tra loro per le stesse parole chiave e visibilità. È già abbastanza difficile competere con tutti gli altri, perché renderlo più difficile competendo anche con te stesso?

In definitiva, non puoi semplicemente ignorare i problemi di contenuto duplicato SEO. Quando possibile, prova a consolidare o rimuovere i contenuti duplicati.

5. Diminuzione del patrimonio netto di collegamento

Diciamo che Google decide di classificare due delle tue pagine sensibilmente simili. Come fanno a sapere se attribuire tutto il valore del contenuto a una pagina o se l'autorità, l'equità di collegamento e la fiducia dovrebbero invece essere divisi tra entrambe le pagine? Questa situazione può ridurre il valore SEO dei tuoi contenuti, causandone un rendimento inferiore.

Anche l'equità dei link dei tuoi backlink sarà divisa tra le due pagine a seconda che altri siti scelgano di collegarsi.

Come verificare la presenza di contenuti duplicati sul proprio sito

Trovare contenuti duplicati sul tuo sito è facile e gratuito. Usa le versioni gratuite di Screaming Frog e Siteliner per eseguire metodicamente la scansione del tuo sito e identificare eventuali pagine esatte o quasi duplicate.

Come utilizzare Screaming Frog per scoprire contenuti duplicati

Screaming Frog è un crawler di siti Web e uno strumento di audit SEO che può aiutarti a identificare problemi di contenuti duplicati sul tuo sito Web. Ecco come utilizzare Screaming Frog per scansionare gratuitamente fino a 500 URL.

1. Scansiona il tuo sito con SEO Spider

Per prima cosa, scarica e apri Screaming Frog. Digita l'URL del sito Web di cui desideri eseguire la scansione nel campo "Inserisci URL per Spider" e fai clic su "Inizia".

screenshot di seo spider

2. Verifica la presenza di duplicati nella scheda "Contenuto".

Fare clic sulla scheda "Contenuto" per verificare la presenza di duplicati esatti e quasi duplicati. Sarai in grado di vedere i duplicati esatti in tempo reale, ma devi eseguire un'"analisi della scansione" per vedere l'elenco dei duplicati vicini.

trovare contenuti duplicati con screamingfrog

3. Verifica la presenza di quasi duplicati

Fai clic sulla scheda "Analisi della scansione" nella barra dei menu e scegli "Inizia" dal menu a discesa.

Al termine dell'analisi della scansione, vedrai le colonne popolate vicino a duplicate. Saprai che è terminato perché la barra di avanzamento "analisi" leggerà il 100% e il filtro quasi duplicato non mostrerà più un messaggio "analisi scansione richiesta".

trovare contenuti quasi duplicati con la rana urlante

4. Visualizza i duplicati nella scheda "Contenuto".

La "corrispondenza di somiglianza più stretta", "No. Le colonne Near Duplicates" e "Address" verranno popolate una volta completata l'analisi di scansione.

Il filtro "Duplicati esatti" visualizzerà pagine identiche tra loro in base a una scansione del codice HTML. La soglia di somiglianza impostata determina ciò che si qualifica come "quasi duplicati". Per modificare la soglia, vai su 'Config → Spider → Contenuto. Questa soglia è impostata al 90% per impostazione predefinita, ma sei libero di cambiarla come preferisci.

Ora che la scansione è terminata, rivedi manualmente qualsiasi pagina che appare come un duplicato esatto o quasi.

Come utilizzare Siteliner per scoprire contenuti duplicati

Siteliner è un altro strumento gratuito che puoi utilizzare per scansionare il tuo sito Web (o qualsiasi sito Web) alla ricerca di contenuti duplicati. Tuttavia, la versione gratuita ti limiterà a un utilizzo ogni 30 giorni e limiterà il numero di risultati a 250 pagine. Se devi eseguire più ricerche o vuoi vedere più risultati, iscriviti alla versione premium.

utilizzando il siteliner per trovare contenuti duplicati

Per verificare la presenza di contenuti duplicati con Siteliner, inserisci l'URL che desideri cercare nella casella di ricerca sulla loro home page.

Siteliner eseguirà quindi un'analisi del sito e ti dirà quanti contenuti duplicati sono stati trovati ed evidenzierà quelli che ritiene essere i tuoi problemi principali. Mostrerà anche molte altre metriche, comprese alcune che possono essere utili per la SEO, come il tempo medio di caricamento della pagina, i collegamenti interni ed esterni e i collegamenti in entrata.

risultati del siteliner per contenuti interni duplicati

Nel menu principale, fai clic su "Contenuto duplicato" per vedere quali pagine Siteline identifica come aventi contenuto duplicato.

Fare clic su ogni singola riga per vedere quale testo è contrassegnato come duplicato.

Nota: Siteline identificherà le intestazioni e i piè di pagina che appaiono su più pagine come contenuti duplicati, quindi potresti ottenere molte pagine con una percentuale di corrispondenza bassa perché ciascuna condivide lo stesso menu o contenuto del piè di pagina.

Come verificare se qualcun altro ha copiato i tuoi contenuti

Esistono anche strumenti di ricerca di contenuti duplicati che puoi utilizzare per verificare se qualcun altro sul Web ha copiato i tuoi contenuti. Copyscape è uno strumento gratuito per la verifica dei contenuti del sito Web, efficace e facile da usare.

Basta inserire un URL nella casella di ricerca e fare clic sul pulsante "Vai" proprio accanto ad esso. Copyscape eseguirà quindi una ricerca in tutto il Web per vedere se il contenuto di testo simile esiste altrove.

screenshot di copyscape

Se trova qualcosa, Copyscape restituirà i risultati e li organizzerà in un elenco che assomiglia un po' ai risultati di ricerca di Google. Ciò ti consente di scorrerli facilmente e vedere quanto dei tuoi contenuti è stato copiato. Puoi pensarlo come un controllo dei contenuti duplicati di Google.

risultati di copyscape per contenuti duplicati esterni

Cosa puoi fare se scopri che qualcun altro ha plagiato i tuoi contenuti?

Innanzitutto, contatta il proprietario del sito web e chiedigli di rimuovere il contenuto o di aggiungere un collegamento canonico al contenuto originale del tuo sito web. Se non funziona, invia una richiesta di rimozione DMCA con Google.

Nota: se hai intenzionalmente distribuito i tuoi contenuti e consentito ad altri siti Web di pubblicarli, verranno comunque visualizzati come duplicati. Ecco perché è importante richiedere al sito di pubblicazione di includere un link canonico o un tag noindex nella pagina per evitare che competa con la tua pagina nel ranking dei motori di ricerca.

Come risolvere il contenuto duplicato

Per risolvere i problemi relativi ai contenuti duplicati, identifica la copia che desideri che Google riconosca come versione originale. Dovrai anche decidere se vuoi rimuovere del tutto le pagine duplicate o se vuoi semplicemente dire a Google di non indicizzarle. A seconda di ciò che decidi, ci sono diversi modi per ripulire i tuoi contenuti duplicati.

Noindex con tag Meta Robots e Robots.txt

Un modo per ridurre al minimo l'impatto dei contenuti duplicati sulla tua SEO consiste nel deindicizzare manualmente le pagine duplicate modificando i tag meta robots. Per fare ciò, usa il meta tag robots e imposta i suoi valori su "noindex, segui". Applica questo tag all'intestazione HTML di ogni pagina che desideri escludere dai risultati di ricerca.

Il tag meta robots consente ai motori di ricerca di eseguire la scansione dei collegamenti sulla pagina in cui è applicato, ma impedisce ai crawler di ricerca di includerli nei loro indici.

Perché consentire a Google di eseguire la scansione della pagina se non vuoi che venga indicizzata? Perché Google ha esplicitamente messo in guardia contro la limitazione dell'accesso per la scansione a qualsiasi contenuto duplicato sul tuo sito. Vogliono sapere che è lì, anche se non vuoi che lo indicizzino.

Un tag noindex dovrebbe assomigliare a questo quando applicato al tuo codice HTML:

<head> [codice] <meta name=”robots” content=”noindex, segui”> [altro codice se necessario] </head>

Il meta tag robots è un modo semplice ed efficace per deindicizzare i contenuti duplicati ed evitare possibili problemi SEO dovuti all'avere pagine duplicate apprezzabilmente simili o esatte sul tuo sito web.

Se disponi di intere directory che desideri bloccare l'indicizzazione di Google e di altri motori di ricerca, modifica il file robots.txt.

301 Reindirizzamenti

Un altro modo per gestire un problema di contenuto duplicato è con un reindirizzamento 301. I 301 sono reindirizzamenti permanenti che inoltrano il traffico dalla pagina duplicata e verso un altro URL. I reindirizzamenti 301 sono SEO friendly e ti aiutano a combinare più pagine in un unico URL in modo da consolidare la loro equità di link.

Quando utilizzi un reindirizzamento 301, la pagina duplicata o notevolmente simile non accetterà più alcun traffico, quindi usala solo quando sei d'accordo con la pagina duplicata non più accessibile, come quando sfogli il contenuto. Se desideri comunque che la pagina sia accessibile, utilizza un meta tag robots per noindex.

Rel canonico

Un altro modo per gestire i tuoi contenuti duplicati è utilizzare l'attributo rel=canonical per dare priorità alle pagine. Inserisci l'attributo rel=canonical all'interno del tag HTML <head> per dire ai motori di ricerca che una pagina specifica esiste come copia di un'altra pagina e che tutti i link e il potere di ranking che appartengono a questa pagina devono essere effettivamente attribuiti al canonico pagina.

Un tag rel=canonical ha un aspetto simile a questo quando applicato al tuo codice HTML:

<head> [code] <link href=”URL DELLA PAGINA PRIORITIZZATA” rel=”canonical” /> </head>

Puoi anche utilizzare un tag canonico autoreferenziale per indicare che desideri che una determinata pagina venga trattata come la versione originale.

Rimuovi gli URL dalla tua Sitemap XML

La tua mappa del sito XML dovrebbe includere solo gli URL che desideri indicizzare. Se non stai utilizzando un URL dinamico che aggiorna automaticamente la tua mappa del sito, dovrai modificare manualmente la tua mappa del sito e rimuovere tutti gli URL che noindex o reindirizzi.

Rimuovi l'URL in Google Search Console

Se scegli di reindirizzare una pagina o limitare l'indicizzazione, chiedi a Google di rimuovere quell'URL dal suo indice.

Accedi alla tua Google Search Console e seleziona "Rimozioni" dal menu a sinistra.

strumento di rimozione URL in GSC

Verrà visualizzata una finestra che ti informa che l'invio di un URL lo cancellerà dall'indice di Google per soli sei mesi. Trascorso tale tempo, se Google esegue la scansione del tuo sito e incontra l'URL, verrà reindicizzato a meno che non sia stato reindirizzato o bloccato da un tag robots. Se hai più URL che condividono un prefisso, puoi anche inviare il prefisso per rimuovere temporaneamente tutti gli URL dall'indice di Google.

richiedere la rimozione dall'indice di Google

Dopo sei mesi, Google proverà a eseguire nuovamente la scansione dei tuoi URL. Se li hai reindirizzati o non indicizzati correttamente, non verranno più visualizzati nella pagina dei risultati dei motori di ricerca (SERP).

Hai bisogno di aiuto per identificare i problemi di SEO tecnologico?

Stai cercando di migliorare la capacità di posizionamento del tuo sito? Collabora con un'agenzia SEO basata sui dati che lavorerà con te per identificare problemi tecnici SEO sul tuo sito Web e sviluppare una strategia SEO vincente per aiutarti a scalare le SERP. Prenota oggi stesso una consulenza SEO gratuita e scopri cosa possiamo fare per te!