Como resolver os problemas com conteúdo duplicado em seu site
Publicados: 2019-06-11Conteúdo duplicado é uma grande preocupação de SEO. Está lá em cima com links duvidosos e evitando as penalidades do Google. Ter conteúdo duplicado pode ser prejudicial ao tráfego orgânico de qualquer site. Todos os envolvidos com SEO entendem isso. Isso não significa que o conteúdo duplicado seja fácil de evitar. Apesar de seus melhores esforços, seu site ainda pode sofrer de problemas com conteúdo duplicado.
Este guia foi desenvolvido para ajudá-lo a resolver esses problemas. Vamos apontar as principais formas pelas quais o conteúdo duplicado pode ocorrer. Em seguida, entraremos em detalhes sobre o que você pode fazer para evitar e resolver problemas de conteúdo duplicado. Primeiro, porém, vale a pena explicar o que é conteúdo duplicado e por que ele é importante.
Marcar uma consulta
Conteúdo duplicado e Google
A melhor maneira de explicar o que é conteúdo duplicado é observando como o próprio Google o define. Em suas diretrizes de suporte sobre conteúdo duplicado, eles oferecem a seguinte definição:
'Blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são sensivelmente semelhantes.'
Isso é bastante simples e é por isso que o conteúdo duplicado é importante. Isso ocorre porque afeta o que o Google pretende fornecer a seus usuários. O mecanismo de pesquisa se esforça para indexar e exibir páginas com informações distintas. Isso faz parte de seu desejo contínuo de garantir uma melhor experiência do usuário.
As páginas com conteúdo duplicado não se qualificam como tendo informações distintas. Dessa forma, o Google filtrará essas páginas duplicadas. Isso significa que apenas uma das páginas com conteúdo duplicado será listada. Isso pode ter um efeito negativo profundo no tráfego orgânico de um domínio. As páginas que, de outra forma, direcionariam mais tráfego para um site não serão listadas.
É um equívoco comum pensar que o Google impõe penalidades por conteúdo duplicado. Esse não é o caso, mas se eles suspeitarem do uso malicioso de conteúdo duplicado, eles agirão. Isso seria quando o conteúdo é usado para manipular suas classificações. Nesse caso eles:
'Faça os ajustes apropriados na indexação e classificação dos sites envolvidos. Como resultado, a classificação do site pode ser prejudicada ou o site pode ser totalmente removido do índice do Google. Nesse caso, ele não aparecerá mais nos resultados da pesquisa.'
Até agora deve ser óbvio que você deseja evitar conteúdo duplicado em seu site. Mesmo se você tiver o cuidado de fazê-lo, ainda pode ocorrer. Há muitas maneiras de isso acontecer.
Como o conteúdo duplicado pode ocorrer
Como já mencionamos, o conteúdo duplicado pode ser apresentado deliberadamente em um domínio. Geralmente como uma forma de tentar enganar ou manipular as classificações do Google. Todo profissional de SEO agora sabe como os algoritmos do Google são inteligentes. Apenas os mais tolos ou indiferentes deles pensariam que poderiam escapar impunes de tal manipulação.
É muito mais frequente que o conteúdo duplicado em um site se desenvolva naturalmente. Isso será devido a certos problemas técnicos ou simples erro humano. É importante entender as principais maneiras pelas quais isso pode acontecer. Isso ajudará você a identificar seus próprios problemas de conteúdo duplicado. Também facilitará a escolha da melhor solução possível.
As causas de conteúdo duplicado que vamos discutir são as seguintes:
- Parâmetros de URL para filtragem e rastreamento
- Cruzamento da página da categoria do produto
- Descrições de produto duplicadas
- Problemas técnicos com URLs
- Páginas para impressão
- Problemas de criação de conteúdo
Parâmetros de URL para filtragem e rastreamento
Os parâmetros de URL são como sufixos adicionados ao final do URL de uma página. Eles ocorrem em muitas situações e muitas vezes não alteram muito o conteúdo de uma página ou mesmo nada. O problema é que, para um mecanismo de pesquisa, uma URL com um parâmetro diferente no final é uma URL diferente. Se o conteúdo vinculado pelos 'dois' URLs for o mesmo, o Google o identificará como conteúdo duplicado.
Um excelente exemplo disso vem da filtragem de produtos em sites de comércio eletrônico. Quase todos esses tipos de sites permitem que os clientes filtrem produtos. Eles podem querer mostrar apenas produtos dentro de uma determinada faixa de preço ou feitos de um determinado material. O ato de filtrar os produtos adiciona um parâmetro de URL à URL. O conteúdo mostrado – os produtos etc. – serão todos duplicados em outro lugar, no entanto.
Outro exemplo é no caso do rastreamento. Parâmetros de rastreamento permitem que você rastreie as origens dos visitantes do seu site. Isso pode ser crucial para monitorar o ROI de diferentes esforços de SEO. Eles podem se parecer com isto: '/?source=rss'. Eles não têm impacto no conteúdo de uma página, mas também parecem um URL exclusivo para um mecanismo de pesquisa.
Cruzamento de página de categoria de produto
Também um problema específico dos sites de comércio eletrônico é o cruzamento da página da categoria. Muitos sites terão páginas de categorias diferentes que exibem basicamente os mesmos produtos. Isso geralmente é feito por razões bem-intencionadas e compreensíveis.
Por exemplo, um site de presentes pode ter categorias denominadas 'Presentes para ele' e 'Presentes para o dia dos pais'. As duas categorias podem atrair clientes diferentes. Os produtos exibidos nas páginas da categoria, no entanto, serão quase idênticos. Isso é tudo o que importa para o Google e eles podem indexar apenas uma das páginas.
Duplicando descrições de produtos
Um nível abaixo em sites de comércio eletrônico de páginas de categoria são páginas de produtos. Eles também podem ser uma fonte comum de problemas de conteúdo duplicado. Os visitantes dessas páginas esperam que haja uma breve descrição do produto. Será como os recursos e características do produto são vendidos aos clientes.
Sites que vendem muitos produtos geralmente não criam descrições exclusivas para cada um. Muitas empresas simplesmente copiam e colam informações genéricas. Muitas vezes, isso foi fornecido por um fornecedor ou fabricante. Isso leva a muito conteúdo duplicado dentro e entre diferentes domínios.
Os maiores problemas neste caso serão se o seu site vende os mesmos produtos que um varejista muito maior como a Amazon. As descrições copiadas podem levar a página do seu produto a duplicar o conteúdo encontrado na Amazon. O Google definitivamente indexará a página da Amazon em vez da sua.
Problemas técnicos com URLs
Além dos parâmetros de URL, existem alguns outros problemas técnicos de URL que podem levar a problemas de conteúdo duplicado. O primeiro vem na forma de 'IDs de sessão'. Eles são usados em URLs quando os visitantes do site recebem uma 'sessão'. Isso geralmente ocorre para que eles possam adicionar itens a um carrinho de compras e mantê-los lá.
Os IDs de sessão são adicionados a todos os links internos à medida que um visitante viaja pelo seu site. Isso cria muitos URLs que um mecanismo de pesquisa pode visualizar como conteúdo duplicado. Da mesma forma, URLs desarrumados como parte de um CMS podem ter um efeito semelhante. URLs com parâmetros para categoria e artigo que alteram a ordem são exemplos principais.
Páginas para impressão
Seu CMS pode muito bem criar páginas para impressão. Essas páginas serão vinculadas em seu site a partir de páginas de artigos e em outros lugares. O Google poderá encontrar essas páginas, a menos que você as interrompa especificamente (falaremos mais sobre isso depois).

O Google filtrará e indexará apenas uma das páginas duplicadas. Pode ser o original ou a versão para impressão. Você deseja que sua página original seja classificada, não a de impressão. Este último não terá todos os seus anúncios, links e outros conteúdos.
Problemas de criação de conteúdo
A maioria dos itens acima são causas técnicas de problemas de conteúdo duplicado. Onde entra o erro humano é na área de criação de conteúdo. Quase todos os sites hoje em dia têm um blog ou recurso informativo semelhante. Isso os ajuda a fornecer informações úteis aos visitantes. Os blogs geralmente podem abrigar muitos conteúdos duplicados.
Isso pode ser devido a confiar a criação de conteúdo a alguém que você não deveria. Alguém que não entende os problemas que o conteúdo duplicado pode causar. Eles podem copiar ou recriar o conteúdo sem conhecer os problemas de SEO que estão criando. Seus erros podem ser tão pequenos quanto sempre usando as mesmas tags de título. Eles podem ser tão grandes quanto copiar diretamente o conteúdo de outros sites.
Resolvendo problemas com conteúdo duplicado
Agora você deve ter uma ideia de onde seus problemas com conteúdo duplicado podem ter vindo. Os itens acima são todas as causas desses problemas que são comuns a muitos sites. Compreendê-los e saber quais afetaram seu site é crucial. Isso porque as diferentes causas se prestam a diferentes soluções.
Vamos analisar algumas das melhores maneiras de resolver problemas com conteúdo duplicado. Iremos sinalizar quais dos problemas e causas que já mencionamos se encaixam melhor com cada solução à medida que avançamos. Nossas soluções se enquadram em duas categorias:
- Soluções educativas e preventivas
- Soluções práticas e esforços de recuperação
Soluções Educacionais e Preventivas
Em um mundo ideal, você deseja evitar problemas com conteúdo duplicado antes que eles apareçam. Conhecer as causas dos problemas que discutimos é um excelente ponto de partida. Ter esse conhecimento pode ajudá-lo a tomar medidas para garantir que nenhum novo conteúdo caia nos mesmos problemas.
Você pode, por exemplo, desativar IDs de sessão nas configurações do sistema. Isso evitará os problemas de URL duplicados que podem causar. Você pode optar por não incluir páginas para impressão em seu site. Não é como se muitas pessoas tivessem motivos para imprimir páginas hoje em dia. Uma campanha de rastreamento baseada em hashtag também pode ser uma boa alternativa ao rastreamento baseado em parâmetros.
Tendo aprendido sobre as causas do conteúdo duplicado, você está em posição de educar outras pessoas. Eles podem incluir desenvolvedores da Web ou sua equipe de produto. Você pode explicar a eles os problemas relacionados ao cruzamento em categorias de produtos. Dessa forma, eles saberão organizar os produtos de acordo. Os criadores de conteúdo autônomos ou internos também podem ser informados sobre como manter as coisas únicas.
Isso é em um mundo ideal. Na realidade, você pode não conseguir se antecipar a todos os seus problemas de conteúdo duplicado. Nessas circunstâncias, você precisa de algumas soluções práticas. Eles serão o que pode ajudá-lo a se recuperar dos problemas que você já sofre.
Soluções práticas e esforços de recuperação
Nosso guia até agora deve ter mostrado de onde podem ter vindo seus problemas de conteúdo duplicado. Agora também oferecemos algumas dicas para evitar que mais problemas surjam. O que resta é sugerir alguns cursos de ação caso seu site já tenha problemas com conteúdo duplicado. Existem muitas opções diferentes abertas para você.
URLs canônicos
URLs canônicos podem ajudar se o seu problema for com diferentes URLs que levam ao mesmo conteúdo. Como no caso de parâmetros de filtragem ou páginas de categoria, conforme descrito anteriormente. Um URL canônico é o URL 'correto'. É o URL da página que você deseja que o Google indexe entre as que levam ao mesmo conteúdo. Você precisa decidir em cada caso qual página é essa.
Uma vez identificado, é simples informar ao Google qual página é seu URL canônico. Tudo o que você precisa fazer é adicionar um elemento HTML à seção <head> das outras páginas. Chamado de 'elemento de link canônico', ele se parece com isso; 'rel=canônico'. Ele apontará o Google para a página escolhida quando seguido por seu URL.
Redirecionamentos 301
Apontar o Google para URLs canônicos às vezes é descrito como usar 'redirecionamentos suaves'. Isso é o oposto de redirecionamentos 301 completos. Você também pode usá-los se não puder ou não quiser remover o conteúdo duplicado.
Aplicar um redirecionamento 301 a um URL direcionará o Google para a página escolhida. Será então essa página que o motor de busca indexa. Essa pode ser uma solução útil para o problema de sobreposição de páginas de categorias de produtos.
Tudo o que você precisa fazer é identificar qual das categorias é mais valiosa para você do ponto de vista do tráfego da web. Você pode então usar redirecionamentos 301 de outras páginas duplicadas ou sobrepostas para essa categoria.
Tags Noindex
Uma tag Noindex é uma diretiva que pode ser adicionada ao código-fonte HTML de uma página. Ele diz explicitamente ao Google que você não deseja que a página seja indexada. Isso pode impedir que o Google filtre uma página que você deseja indexar em favor de outra que você não deseja.
As tags Noindex são a melhor solução para problemas causados por páginas de impressão. Você deve aplicar uma tag Noindex a cada uma dessas páginas. Isso garantirá que a versão original de cada página seja aquela indexada pelo Google.
Reescrevendo o conteúdo
Às vezes, os problemas de conteúdo duplicado simplesmente não têm uma solução rápida. Esse é o caso se o seu problema for com postagens de blog ou descrições de produtos. Se eles criaram conteúdo duplicado, você precisa encontrar a cópia ofensiva e reescrevê-la. Esta solução é demorada e trabalhosa. Simplesmente não há outra maneira de lidar habilmente com o problema.
Uma maneira de economizar um pouco de tempo e esforço é usar uma ferramenta online gratuita como o Copyscape. O Copyscape foi projetado para ajudá-lo a escrever conteúdo que não seja plagiado. Você pode inserir um URL no site e ele pesquisará na web em busca de conteúdo duplicado. Isso permite que você encontre os elementos exatos do seu conteúdo que precisará cortar, substituir ou reescrever.

Nick Brown é o fundador e CEO da agência de aceleração, uma agência de SaaS SEO. Nick lançou vários negócios on-line de sucesso, escreve para a Forbes, publicou um livro e cresceu rapidamente de uma agência do Reino Unido para uma empresa que agora opera nos EUA, APAC e EMEA e emprega 160 pessoas. Ele também já foi atacado por um gorila da montanha