Cómo resolver los problemas con contenido duplicado en su sitio web
Publicado: 2019-06-11El contenido duplicado es una preocupación importante de SEO. Está ahí arriba con enlaces dudosos y evitando las sanciones de Google. Tener contenido duplicado puede ser perjudicial para el tráfico orgánico de cualquier sitio. Todos los involucrados con SEO entienden esto. Eso no significa que el contenido duplicado sea fácil de evitar. A pesar de sus mejores esfuerzos, su sitio aún podría sufrir problemas con contenido duplicado.
Esta guía está diseñada para ayudarlo a resolver esos problemas. Le indicaremos las principales formas en que puede ocurrir el contenido duplicado. Luego entraremos en el meollo de lo que puede hacer para evitar y resolver problemas de contenido duplicado. Sin embargo, primero vale la pena explicar qué es el contenido duplicado y por qué es importante.
Reserve una consulta
Contenido duplicado y Google
La mejor manera de explicar qué es el contenido duplicado es ver cómo lo define Google. En sus pautas de soporte con respecto al contenido duplicado, ofrecen la siguiente definición:
"Bloques sustanciales de contenido dentro o entre dominios que coinciden completamente con otro contenido o son apreciablemente similares".
Eso es bastante simple, ya que es importante el contenido duplicado. Eso se debe a cómo afecta lo que Google pretende proporcionar a sus usuarios. El motor de búsqueda se esfuerza por indexar y mostrar páginas con información distinta. Eso es parte de su deseo continuo de garantizar una mejor experiencia de usuario.
Las páginas con contenido duplicado no califican como que tienen información distinta. Como tal, Google filtrará esas páginas duplicadas. Eso significa que solo aparecerá una de las páginas con contenido duplicado. Eso puede tener un profundo efecto negativo en el tráfico orgánico de un dominio. Las páginas que de otro modo atraerían más tráfico a un sitio no aparecerán en la lista.
Es un error común pensar que Google impone sanciones por contenido duplicado. Ese no es el caso, pero si sospechan un uso malicioso de contenido duplicado, actuarán. Eso sería cuando el contenido se usa para manipular sus clasificaciones. En ese caso ellos:
'Hacer los ajustes apropiados en la indexación y clasificación de los sitios involucrados. Como resultado, la clasificación del sitio puede verse afectada o el sitio puede eliminarse por completo del índice de Google. En cuyo caso, ya no aparecerá en los resultados de búsqueda.'
A estas alturas, debería ser obvio que desea evitar el contenido duplicado en su sitio. Incluso si tiene cuidado de hacerlo, todavía puede ocurrir. Hay muchas maneras en que esto puede suceder.
Cómo puede ocurrir el contenido duplicado
Como ya mencionamos, el contenido duplicado puede aparecer deliberadamente en un dominio. Por lo general, como una forma de intentar engañar o manipular las clasificaciones de Google. Todos los profesionales de SEO ahora saben cuán inteligentes son los algoritmos de Google. Solo los más tontos o indiferentes pensarían que podrían salirse con la suya con tal manipulación.
Es mucho más frecuente que el contenido duplicado en un sitio se haya desarrollado de forma natural. Eso será debido a ciertos problemas técnicos o un simple error humano. Es importante comprender las principales formas en que esto puede suceder. Le ayudará a identificar sus propios problemas de contenido duplicado. También facilitará la elección de la mejor solución posible.
Las causas del contenido duplicado que vamos a discutir son las siguientes:
- Parámetros de URL para filtrado y seguimiento
- Cruce de página de categoría de producto
- Descripciones de productos duplicadas
- Problemas técnicos con las URL
- Páginas aptas para imprimir
- Problemas de creación de contenido.
Parámetros de URL para filtrado y seguimiento
Los parámetros de URL son como sufijos agregados al final de la URL de una página. Ocurren en muchas situaciones y, a menudo, no cambian mucho o nada el contenido de una página. El problema es que para un motor de búsqueda una URL con un parámetro diferente al final es una URL diferente. Si el contenido vinculado por las 'dos' URL es el mismo, Google lo identificará como contenido duplicado.
Un excelente ejemplo de esto proviene del filtrado de productos en sitios de comercio electrónico. Casi todos esos tipos de sitios permiten a los clientes filtrar productos. Es posible que deseen mostrar solo productos dentro de un cierto rango de precios o hechos de un material en particular. El acto de filtrar los productos agrega un parámetro de URL a la URL. Sin embargo, el contenido que se muestra (los productos, etc.) se duplicará en otros lugares.
Otro ejemplo es en el caso del seguimiento. Los parámetros de seguimiento le permiten rastrear las fuentes de los visitantes de su sitio. Esto puede ser crucial para monitorear el ROI de diferentes esfuerzos de SEO. Pueden verse así: '/?source=rss'. No tienen impacto en el contenido de una página, pero también se ven en un motor de búsqueda como una URL única.
Cruce de página de categoría de producto
También un problema particular de los sitios de comercio electrónico es el cruce de páginas de categorías. Muchos sitios tendrán páginas de diferentes categorías que muestran principalmente los mismos productos. Esto se hace a menudo por razones bien intencionadas y comprensibles.
Por ejemplo, un sitio de regalos puede tener categorías denominadas 'Regalos para él' y 'Regalos del día del padre'. Las dos categorías bien pueden atraer a diferentes clientes. Sin embargo, los productos que se muestran en las páginas de categorías serán casi idénticos. Eso es todo lo que le importará a Google y es posible que solo indexen una de las páginas.
Duplicación de descripciones de productos
Un nivel más abajo en los sitios de comercio electrónico de las páginas de categoría son las páginas de productos. Estos también pueden ser una fuente común de problemas de contenido duplicado. Los visitantes de dichas páginas esperarán que haya una breve descripción del producto. Será cómo se vendan a los clientes las prestaciones y características del producto.
Los sitios que venden muchos productos a menudo no crean descripciones únicas para cada uno. Muchas empresas simplemente copian y pegan información genérica. A menudo, eso ha sido proporcionado por un proveedor o fabricante. Eso lleva a un montón de contenido duplicado dentro y entre diferentes dominios.
Los mayores problemas en este caso serán si su sitio vende los mismos productos que un minorista mucho más grande como Amazon. Las descripciones copiadas pueden llevar a la página de su producto a duplicar el contenido que se encuentra en Amazon. Google definitivamente indexará la página de Amazon en lugar de la tuya.
Problemas técnicos con las URL
Además de los parámetros de URL, hay un par de otros problemas técnicos de URL que pueden generar problemas de contenido duplicado. El primero viene en forma de 'ID de sesión'. Estos se utilizan en las URL cuando los visitantes del sitio reciben una 'sesión'. Eso es a menudo para que puedan agregar artículos a un carrito de compras y hacer que permanezcan allí.
Los ID de sesión se agregan a cada enlace interno a medida que un visitante viaja por su sitio. Eso crea muchas URL que un motor de búsqueda puede ver como contenido duplicado. De manera similar, las URL desordenadas como parte de un CMS pueden tener un efecto similar. Las URL con parámetros para la categoría y el artículo que cambian de orden son buenos ejemplos.
Páginas aptas para imprimir
Su CMS bien podría crear páginas fáciles de imprimir. Estas páginas estarán vinculadas a su sitio desde páginas de artículos y en otros lugares. Google podrá encontrar estas páginas a menos que las detenga específicamente (más sobre eso más adelante).

Google filtrará e indexará solo una de las páginas duplicadas. Esa podría ser la versión original o la versión para imprimir. Desea que su página original se clasifique, no la que se imprime fácilmente. Este último no tendrá todos sus anuncios, enlaces y otro contenido.
Problemas de creación de contenido
La mayoría de los anteriores son causas técnicas de problemas de contenido duplicado. Donde entra el error humano es en el área de creación de contenido. Casi todos los sitios en estos días tienen un blog o un recurso informativo similar. Les ayuda a proporcionar información útil a los visitantes. Los blogs a menudo pueden albergar una gran cantidad de contenido duplicado.
Esto puede deberse a confiar la creación de contenido a alguien que no deberías. Alguien que no entiende los problemas que puede causar el contenido duplicado. Pueden copiar o recrear contenido sin conocer los problemas de SEO que están creando. Sus errores pueden ser tan pequeños como usar siempre las mismas etiquetas de título. Podrían ser tan grandes como copiar contenido directamente de otros sitios.
Resolución de problemas con contenido duplicado
Ahora debería tener una idea de dónde pueden provenir sus problemas con el contenido duplicado. Las anteriores son todas las causas de los problemas que son comunes a muchos sitios. Comprenderlos y saber cuáles han afectado su sitio es crucial. Eso es porque las diferentes causas se prestan a diferentes soluciones.
Vamos a repasar algunas de las mejores formas de resolver problemas con contenido duplicado. Marcaremos cuáles de los problemas y causas que ya hemos mencionado encajan mejor con cada solución a medida que avanzamos. Nuestras soluciones encajan en dos categorías:
- Soluciones educativas y preventivas
- Soluciones prácticas y esfuerzos de recuperación
Soluciones educativas y preventivas
En un mundo ideal, desea evitar problemas con contenido duplicado antes de que surjan. Conocer las causas de los problemas que hemos discutido es un excelente punto de partida. Tener ese conocimiento puede ayudarlo a tomar medidas para asegurarse de que ningún contenido nuevo tenga los mismos problemas.
Puede, por ejemplo, deshabilitar las ID de sesión en la configuración de su sistema. Eso evitará los problemas de URL duplicados que pueden causar. Puede optar por no incluir páginas aptas para imprimir en su sitio web. No es como si muchas personas tuvieran motivos para imprimir páginas hoy en día de todos modos. Una campaña de seguimiento basada en hashtags también puede ser una buena alternativa al seguimiento basado en parámetros.
Habiendo aprendido acerca de las causas del contenido duplicado, está en posición de educar a otros. Pueden incluir desarrolladores web o su equipo de producto. Puede explicarles los problemas relacionados con el cruce en las categorías de productos. De esa manera sabrán organizar los productos en consecuencia. Los creadores de contenido independientes o internos también pueden recibir información sobre cómo mantener las cosas únicas.
Eso es en un mundo ideal. En realidad, es posible que no pueda adelantarse a todos sus problemas de contenido duplicado. En esas circunstancias, necesita algunas soluciones prácticas. Serán lo que pueda ayudarte a recuperarte de los problemas que ya estás sufriendo.
Soluciones prácticas y esfuerzos de recuperación
Nuestra guía hasta ahora debería haberle mostrado de dónde pueden provenir sus problemas de contenido duplicado. Ahora también hemos ofrecido algunos consejos para evitar que surjan más problemas. Lo que queda es sugerir algunos cursos de acción si su sitio ya tiene problemas con contenido duplicado. Hay muchas opciones diferentes abiertas para usted.
URL canónicas
Las URL canónicas pueden ayudar si su problema es con diferentes URL que conducen al mismo contenido. Como en el caso de los parámetros de filtrado o las páginas de categorías, como se describió anteriormente. Una URL canónica es la URL "correcta". Es la URL de la página que desea que Google indexe entre las que conducen al mismo contenido. Tienes que decidir en cada caso qué página es esa.
Una vez identificado, es sencillo decirle a Google qué página es su URL canónica. Todo lo que necesita hacer es agregar un elemento HTML a la sección <head> de las otras páginas. Llamado el 'elemento de enlace canónico', se ve así; 'rel=canónico'. Apuntará a Google a la página elegida cuando sea seguido por su URL.
Redirecciones 301
Dirigir a Google a URL canónicas a veces se describe como usar 'redireccionamientos suaves'. Eso es lo opuesto a las redirecciones 301 completas. También puede usarlos si no puede o no quiere eliminar el contenido duplicado.
La aplicación de una redirección 301 a una URL dirigirá a Google hacia la página elegida. Será entonces esa página la que indexe el motor de búsqueda. Esta podría ser una solución útil para el problema de la superposición de páginas de categorías de productos.
Todo lo que necesita hacer es identificar cuál de las categorías es más valiosa para usted desde el punto de vista del tráfico web. Luego puede usar redireccionamientos 301 desde las otras páginas duplicadas o superpuestas a esa categoría.
Etiquetas sin índice
Una etiqueta Noindex es una directiva que se puede agregar al código fuente HTML de una página. Le dice explícitamente a Google que no desea que la página sea indexada. Eso puede evitar que Google filtre una página que desea indexar a favor de una que no desea.
Las etiquetas Noindex son la mejor solución para los problemas causados por las páginas fáciles de imprimir. Debe aplicar una etiqueta Noindex a cada una de esas páginas. Eso asegurará que la versión original de cada página sea la que indexe Google.
Reescritura de contenido
A veces, los problemas de contenido duplicado simplemente no tienen una solución rápida. Ese es el caso si su problema es con publicaciones de blog o descripciones de productos. Si han creado contenido duplicado, debe encontrar la copia ofensiva y volver a escribirla. Esta solución requiere mucho tiempo y mano de obra. Simplemente no hay otra manera de lidiar hábilmente con el problema.
Una forma de ahorrarse un poco de tiempo y esfuerzo es usar una herramienta en línea gratuita como Copyscape. Copyscape está diseñado para ayudarte a escribir contenido que no esté plagiado. Puede ingresar una URL en el sitio y buscará en la web contenido duplicado. Eso le permite encontrar los elementos exactos de su contenido que necesitará cortar, reemplazar o reescribir.

Nick Brown es el fundador y director ejecutivo de la agencia de aceleración, una agencia de SEO SaaS. Nick ha lanzado varios negocios en línea exitosos, escribe para Forbes, publicó un libro y ha crecido aceleradamente de una agencia del Reino Unido a una empresa que ahora opera en EE. UU., APAC y EMEA y emplea a 160 personas. Una vez también fue atacado por un gorila de montaña.