Cum să rezolvi problemele cu conținutul duplicat de pe site-ul tău web

Publicat: 2019-06-11

Conținutul duplicat este o preocupare majoră pentru SEO. Este acolo sus, cu link-uri suspecte și evitând penalitățile Google. A avea conținut duplicat poate dăuna traficului organic al oricărui site. Toți cei implicați în SEO înțeleg acest lucru. Asta nu înseamnă că conținutul duplicat este ușor de evitat. În ciuda eforturilor depuse, site-ul dvs. ar putea avea în continuare probleme cu conținutul duplicat.

Acest ghid este conceput pentru a vă ajuta să rezolvați aceste probleme. Vă vom indica principalele modalități prin care poate apărea conținutul duplicat. Vom intra apoi în esențialul a ceea ce puteți face pentru a evita și a rezolva problemele de conținut duplicat. În primul rând, totuși, merită să explicăm ce este conținutul duplicat și de ce este important.

Rezervați o consultație

Conținut duplicat și Google

Cea mai bună modalitate de a explica ce este conținutul duplicat este să vă uitați la modul în care Google înșiși îl definește. În ghidurile lor de asistență cu privire la conținutul duplicat, ei oferă următoarea definiție:

„Blocuri substanțiale de conținut în sau între domenii care fie se potrivesc complet cu alt conținut, fie sunt considerabil similare.”

Acesta este destul de simplu și de aceea este important conținutul duplicat. Acest lucru se întâmplă din cauza modului în care afectează ceea ce Google își propune să ofere utilizatorilor. Motorul de căutare se străduiește să indexeze și să afișeze pagini cu informații distincte. Aceasta face parte din dorința lor continuă de a asigura o experiență mai bună pentru utilizator.

Paginile cu conținut duplicat nu se califică ca având informații distincte. Ca atare, Google va filtra acele pagini duplicat. Aceasta înseamnă că doar una dintre paginile care prezintă conținut duplicat va fi listată. Acest lucru poate avea un efect negativ profund asupra traficului organic al unui domeniu. Paginile care altfel ar genera mai mult trafic către un site nu vor fi listate deloc.

Este o concepție greșită comună că Google impune penalități pentru conținutul duplicat. Nu este cazul, dar dacă bănuiesc utilizarea rău intenționată a conținutului duplicat, vor acționa. Acesta ar fi momentul în care conținutul este folosit pentru a le manipula clasamentele. În acest caz, ei:

„Efectuați ajustările corespunzătoare în indexarea și clasarea site-urilor implicate. Ca urmare, clasarea site-ului poate avea de suferit sau site-ul ar putea fi eliminat complet din indexul Google. În acest caz, nu va mai apărea în rezultatele căutării.'

Până acum ar trebui să fie evident că doriți să evitați conținutul duplicat pe site-ul dvs. Chiar dacă ești atent să faci asta, tot se poate întâmpla. Există multe moduri în care acest lucru se poate întâmpla.

Cum poate apărea conținutul duplicat

După cum am menționat deja, conținutul duplicat poate fi prezentat în mod deliberat pe un domeniu. De obicei, ca o modalitate de a încerca să păcăliți sau să manipulați clasamentele Google. Fiecare profesionist SEO știe acum cât de inteligenți sunt algoritmii Google. Doar cei mai proști sau nepăsători dintre ei ar crede că ar putea scăpa cu o asemenea manipulare.

Este mult mai des cazul în care conținutul duplicat de pe un site sa dezvoltat în mod natural. Acest lucru se va datora fie anumitor probleme tehnice, fie unei simple erori umane. Este important să înțelegeți principalele moduri în care acest lucru se poate întâmpla. Vă va ajuta să identificați propriile probleme de conținut duplicat. De asemenea, va fi mai ușor să alegeți cea mai bună soluție posibilă.

Cauzele conținutului duplicat pe care le vom discuta sunt următoarele:

  • Parametri URL pentru filtrare și urmărire
  • Încrucișarea paginilor categoriei de produse
  • Descrieri duplicate ale produselor
  • Probleme tehnice cu adresele URL
  • Pagini prietenoase cu imprimanta
  • Probleme de creare de conținut

Parametri URL pentru filtrare și urmărire

Parametrii URL sunt ca sufixele adăugate la sfârșitul adresei URL a unei pagini. Acestea apar în multe situații și adesea nu schimbă foarte mult sau chiar deloc conținutul unei pagini. Problema este că pentru un motor de căutare o adresă URL cu un parametru diferit la sfârșit este o adresă URL diferită. Dacă conținutul la care face legătura cu cele „două” adrese URL este același, Google îl va identifica ca conținut duplicat.

Un prim exemplu în acest sens vine din filtrarea produselor de pe site-urile de comerț electronic. Aproape toate aceste tipuri de site-uri permit clienților să filtreze produsele. Este posibil ca aceștia să dorească să arate numai produse dintr-un anumit interval de preț sau dintr-un anumit material. Actul de filtrare a produselor adaugă un parametru URL la adresa URL. Cu toate acestea, conținutul afișat – produsele etc. – va fi duplicat în altă parte.

Un alt exemplu este în cazul urmăririi. Parametrii de urmărire vă permit să urmăriți sursele vizitatorilor site-ului dvs. Acest lucru poate fi crucial pentru monitorizarea rentabilității investiției diferitelor eforturi SEO. Ele pot arăta cam așa: '/?source=rss'. Ele nu au niciun impact asupra conținutului unei pagini, dar se uită și la un motor de căutare ca o adresă URL unică.

Încrucișarea paginilor categoriei de produse

De asemenea, o problemă specifică site-urilor de comerț electronic este cea a încrucișării paginilor de categorie. Multe site-uri vor avea pagini de categorii diferite care afișează în principal aceleași produse. Acest lucru se face adesea din motive bine intenționate și de înțeles.

De exemplu, un site de cadouri poate avea categorii numite „Cadouri pentru el” și „Cadouri de Ziua Tatălui”. Cele două categorii pot atrage clienți diferiți. Produsele afișate pe paginile categoriei vor fi însă aproape identice. Acesta este tot ceea ce va conta pentru Google și s-ar putea să indexeze doar una dintre pagini.

Duplicarea descrierilor de produse

Un nivel mai jos pe site-urile de comerț electronic din paginile de categorii sunt paginile de produse. Acestea pot fi, de asemenea, o sursă comună de probleme de conținut duplicat. Vizitatorii acestor pagini se vor aștepta să existe o scurtă descriere a produsului. Acesta va fi modul în care caracteristicile și caracteristicile produsului sunt vândute clienților.

Site-urile care vând o mulțime de produse adesea nu creează descrieri unice pentru fiecare. Multe firme pur și simplu copiază și lipește informații generice. Adesea, aceasta a fost furnizată de un furnizor sau producător. Acest lucru duce la o mulțime de conținut duplicat în și pe diferite domenii.

Cele mai mari probleme în acest caz vor fi dacă site-ul dvs. vinde aceleași produse ca un retailer mult mai mare precum Amazon. Descrierile copiate pot duce pagina produsului la conținut duplicat găsit pe Amazon. Google va indexa cu siguranță pagina Amazon și nu a ta.

Probleme tehnice cu adresele URL

Pe lângă parametrii URL, există alte câteva probleme tehnice ale adresei URL care pot duce la probleme de conținut duplicat. Primul vine sub forma „ID-urilor de sesiune”. Acestea sunt folosite în adrese URL atunci când vizitatorilor site-ului li se oferă o „sesiune”. Acest lucru este adesea pentru ca aceștia să poată adăuga articole într-un coș de cumpărături și să le permită să rămână acolo.

ID-urile de sesiune sunt adăugate la fiecare link intern pe măsură ce un vizitator călătorește pe site-ul dvs. Acest lucru creează o mulțime de adrese URL pe care un motor de căutare le poate vedea ca conținut duplicat. În mod similar, adresele URL neîngrijite ca parte a unui CMS pot avea un efect similar. Adresele URL cu parametri pentru categorie și articol care modifică ordinea sunt exemple principale.

Pagini prietenoase cu imprimanta

CMS-ul dvs. ar putea crea pagini prietenoase cu imprimanta. Aceste pagini vor fi legate de pe site-ul dvs. din paginile cu articole și din alte părți. Google va putea găsi aceste pagini dacă nu le opriți în mod specific (mai multe despre asta mai târziu).

Google va filtra și indexa doar una dintre paginile duplicate. Aceasta ar putea fi versiunea originală sau pentru imprimantă. Vrei ca pagina ta originală să fie clasată, nu cea pentru imprimantă. Acesta din urmă nu va avea toate anunțurile, linkurile și alt conținut.

Probleme legate de crearea de conținut

Cele mai multe dintre cele de mai sus sunt cauze tehnice ale problemelor de conținut duplicat. Unde intervine eroarea umană este în zona creării de conținut. Aproape fiecare site în zilele noastre are un blog sau o resursă informațională similară. Îi ajută să ofere informații utile vizitatorilor. Blogurile pot găzdui adesea o mulțime de conținut duplicat.

Acest lucru se poate datora creării de conținut încrederea unei persoane pe care nu ar trebui. Cineva care nu înțelege problemele pe care le poate cauza conținutul duplicat. Ei pot copia sau recrea conținut fără să cunoască problemele SEO pe care le creează. Erorile lor pot fi la fel de mici ca întotdeauna folosind aceleași etichete de titlu. Acestea ar putea fi la fel de mari precum copierea directă a conținutului de pe alte site-uri.

Rezolvarea problemelor cu conținut duplicat

Acum ar trebui să aveți o idee despre de unde ar fi putut veni problemele dvs. cu conținutul duplicat. Cele de mai sus sunt toate cauzele acelor probleme care sunt comune pentru multe site-uri. Înțelegerea acestora și cunoașterea celor care v-au afectat site-ul este crucială. Asta pentru că diferitele cauze se pretează la soluții diferite.

Vom analiza câteva dintre cele mai bune modalități de a rezolva problemele legate de conținutul duplicat. Vom semnala care dintre problemele și cauzele pe care le-am menționat deja se potrivește cel mai bine cu fiecare soluție pe măsură ce mergem. Soluțiile noastre se încadrează în două categorii:

  • Soluții educaționale și preventive
  • Soluții practice și eforturi de recuperare

Soluții educaționale și preventive

Într-o lume ideală, doriți să evitați problemele cu conținutul duplicat înainte ca acestea să apară. Cunoașterea cauzelor problemelor pe care le-am discutat este un punct de plecare excelent. Având aceste cunoștințe, vă poate ajuta să luați măsuri pentru a vă asigura că niciun conținut nou nu va fi afectat de aceleași probleme.

Puteți, de exemplu, să dezactivați ID-urile de sesiune din setările sistemului dvs. Acest lucru va preveni problemele URL duplicat pe care acestea le pot cauza. Ai putea alege să renunți la includerea paginilor prietenoase pentru imprimantă pe site-ul tău web. Oricum, nu este ca și cum mulți oameni ar avea motive să imprime pagini în zilele noastre. O campanie de urmărire bazată pe hashtag poate fi, de asemenea, o alternativă bună la urmărirea bazată pe parametri.

După ce ați aflat despre cauzele conținutului duplicat, sunteți în măsură să îi educați pe alții. Acestea pot include dezvoltatori web sau echipa de produse. Le puteți explica problemele legate de crossover în categorii de produse. Astfel ei vor ști să aranjeze produsele în consecință. Creatorii de conținut independenți sau interni pot fi, de asemenea, informați cu privire la păstrarea lucrurilor unice.

Asta într-o lume ideală. În realitate, este posibil să nu reușiți să treceți înaintea tuturor problemelor de conținut duplicat. În aceste circumstanțe aveți nevoie de câteva soluții practice. Ele vor fi cele care vă pot ajuta să vă recuperați de problemele de care suferiți deja.

Soluții practice și eforturi de recuperare

Ghidul nostru de până acum ar fi trebuit să vă arate de unde ar fi putut veni problemele de conținut duplicat. Am oferit acum și câteva sfaturi pentru a evita să apară mai multe probleme. Ceea ce a mai rămas este să sugerați câteva cursuri de acțiune pentru dacă site-ul dvs. are deja probleme cu conținutul duplicat. Sunt disponibile o mulțime de opțiuni diferite.

URL-uri canonice

Adresele URL canonice vă pot ajuta dacă problema dvs. este legată de adrese URL diferite care duc la același conținut. Ca și în cazul parametrilor de filtrare sau al paginilor de categorii, așa cum este descris mai devreme. O adresă URL canonică este adresa URL „corectă”. Este adresa URL a paginii pe care doriți să o indexeze Google dintre cele care duc la același conținut. Trebuie să decideți în fiecare caz ce pagină este.

Odată identificat, este simplu să spuneți Google care pagină este adresa URL canonică. Tot ce trebuie să faceți este să adăugați un element HTML în secțiunea <head> a celorlalte pagini. Numit „element canonic link”, arată astfel; 'rel=canonic'. Acesta va direcționa Google către pagina aleasă de dvs. atunci când este urmat de adresa URL a acesteia.

301 Redirecționări

Îndreptarea către Google către adrese URL canonice este uneori descrisă ca folosind „redirecționări soft”. Aceasta este spre deosebire de redirecționările 301 cu drepturi depline. Le puteți folosi și dacă nu puteți sau nu doriți să eliminați conținutul duplicat.

Aplicarea unei redirecționări 301 la o adresă URL va conduce Google către pagina aleasă. Va fi apoi pagina pe care motorul de căutare o indexează. Aceasta ar putea fi o soluție utilă la problema suprapunerii paginilor categoriilor de produse.

Tot ce trebuie să faceți este să identificați care dintre categorii este cea mai valoroasă pentru dvs. din punct de vedere al traficului web. Puteți utiliza apoi redirecționări 301 către din celelalte pagini duplicate sau suprapuse către acea categorie.

Etichete Noindex

O etichetă Noindex este o directivă care poate fi adăugată la codul sursă HTML al unei pagini. Acesta îi spune în mod explicit Google că nu doriți ca pagina să fie indexată. Acest lucru poate împiedica Google să filtreze o pagină pe care doriți să o indexeze în favoarea uneia pe care nu o faceți.

Etichetele Noindex sunt cea mai bună soluție pentru problemele cauzate de paginile prietenoase cu imprimanta. Ar trebui să aplicați o etichetă Noindex la fiecare dintre aceste pagini. Acest lucru va asigura că versiunea originală a fiecărei pagini va fi cea pe care Google o indexează.

Rescrierea conținutului

Uneori, problemele de conținut duplicat pur și simplu nu au o soluție rapidă. Acesta este cazul dacă problema dvs. este legată de postările de pe blog sau de descrierile produselor. Dacă au creat conținut duplicat, trebuie să găsiți copia jignitoare și să o rescrieți. Această soluție necesită timp și necesită multă muncă. Doar că nu există o altă modalitate de a rezolva problema.

O modalitate prin care vă puteți economisi puțin timp și efort este utilizarea unui instrument online gratuit precum Copyscape. Copyscape este conceput pentru a vă ajuta să scrieți conținut care nu este plagiat. Puteți introduce o adresă URL în site și va căuta pe web conținut duplicat. Acest lucru vă permite să găsiți elementele exacte ale conținutului pe care va trebui să le tăiați, să le înlocuiți sau să le rescrieți.