Páginas huérfanas: cómo encontrarlas y corregirlas para mejorar el SEO
Publicado: 2022-09-11¿Qué es una página huérfana?

Una página huérfana es una página en un sitio web que no tiene enlaces que apunten a ella. No se puede acceder a estas páginas porque no tienen conexiones internas que los rastreadores o los usuarios puedan utilizar para llegar a ellas mientras navegan por su sitio web.
Debido a que algunos sitios web ocultan sus páginas de destino a propósito, las páginas huérfanas se presentan con frecuencia con una etiqueta de "aviso" en lugar de una etiqueta de "error".
Los motores de búsqueda no encontrarán los sitios huérfanos, por lo que es fundamental comprobar su sitio web en busca de ellos. Esto se debe a la forma en que Google descubre nuevas páginas web en un sitio web:
- Los rastreadores reconocen las URL de las páginas mencionadas en su mapa del sitio XML.
- Los rastreadores buscan URL que estén vinculadas a otro sitio web, ya sea interna o externamente.
Si desea que los motores de búsqueda indexen y encuentren una página web, deberá buscar páginas huérfanas en su sitio y realizar los pasos correspondientes.
¿Son las páginas huérfanas un problema de SEO?

Cuando un motor de búsqueda no puede encontrar una página a través de enlaces, generalmente se ignora. Incluso si su página web está incluida en el mapa del sitio XML de su sitio web, aún puede ser un problema para el SEO:
- Los sitios huérfanos pueden incluir información desactualizada, lo que reduce la autoridad de su dominio.
- Durante el proceso de migración del sitio web, las páginas suelen quedar huérfanas. Esto es un problema porque las páginas huérfanas pueden tener contenido útil que puede ayudarlo a mejorar su clasificación.
- Más páginas huérfanas en su sitio web pueden confundir a los motores de búsqueda con respecto al contexto de su contenido, lo que reduce su clasificación SERP.
Páginas huérfanas frente a páginas sin salida

Es crucial comprender la diferencia entre las páginas sin salida y las páginas huérfanas.
El término "huérfano" se refiere a las páginas que no están conectadas o accesibles desde otras páginas. Las páginas sin salida, por otro lado, no están vinculadas a ningún sitio web externo o interno para que los rastreadores o las personas exploren. Como resultado, se crea un "callejón sin salida", de ahí el término.
Cuando un usuario llega a una página sin salida, tiene dos opciones: abandonar el sitio web o regresar. Los rastreadores de los motores de búsqueda, del mismo modo, no pueden transmitir ninguna equidad de enlace porque no tienen adónde ir desde las páginas sin salida.
Si bien cualquier página sin salida puede arreglarse simplemente agregando enlaces al contenido o agregando barras laterales/navegación de pie de página, las páginas huérfanas son diferentes. Veamos cómo localizar y reparar páginas huérfanas.
LEE TAMBIÉN: Impacto del marketing en la sociedad
¿Cómo encontrar páginas huérfanas en un sitio web?
Obtenga una lista de las URL de su sitio web
Encontrar páginas huérfanas es una tarea que requiere mucho tiempo y, a veces, es imposible para los rastreadores. Como resultado, usar una herramienta de SEO sería un desafío porque depende de los datos recopilados por los rastreadores.
La mejor técnica para detectar una página huérfana es utilizar un informe de Google Analytics para recopilar una lista de todas las URL de su sitio web. Puede hacer esto fácilmente con cualquier otro software de análisis que elija.
La página aparecerá en el informe de Analytics si alguna vez se ha visto. Hay un registro de la URL en algún lugar, y si observa la parte de páginas vistas del informe, puede encontrarlo fácilmente.
Resolver problemas de página duplicada
Es posible que la razón más frecuente de las páginas huérfanas ni siquiera sea algo que consideres. La duplicación de páginas es un problema que con frecuencia se descuida y debe abordarse de inmediato. Cada página duplicada solo debe redirigir a una URL, y si no lo hace, las versiones de esa página seguramente no estarán conectadas. Como resultado, pueden convertirse en páginas huérfanas.
El hecho de que estas páginas estén duplicadas es la preocupación fundamental en esta circunstancia. Cuando busque páginas huérfanas en su sitio web como parte de una auditoría del sitio, este debería ser el primer lugar que examine. Hay dos tipos de duplicación de página a tener en cuenta:
1. Páginas no canónicas

Los protocolos https o http, así como www o non-www en las URL, deben usarse de manera consistente en cada página de su sitio web.
Como resultado, debe examinar cada una de sus páginas públicas poniendo todas las variaciones de sus páginas en el navegador, como esta:
- https://www.xyz.com
- http://www.xyz.com
- https://xyz.com
- http://xyz.com
Todas estas versiones deberían llevar a los lectores a la misma página, con la misma URL. Las páginas web se volverán canónicas a sí mismas como resultado de esto. Si alguna de estas variaciones no logra redirigir la búsqueda a la página web adecuada, debe tener en cuenta que puede estar lidiando con un problema común. También debe consultar otros sitios web, cualquiera que sea la variación que esté causando el problema.
2. Barras diagonales

Este es otro pequeño detalle a tener en cuenta que puede tener una influencia significativa. Si no utiliza barras diagonales finales de manera consistente en su sitio web, algunas de sus páginas pueden quedar huérfanas. Veamos otro escenario:
- https://ejemplo.com/pagina1/
- https://ejemplo.com/pagina1
Estas URL pueden ofrecer el mismo contenido a los visitantes, pero sus URL son distintas.
Verifique sus páginas web para ambas versiones para determinar si los usuarios están siendo enviados a la misma página. Asegúrese de que esto se haga de manera uniforme en todas sus páginas web. Puede usar ".htaccess" para que este procedimiento se solucione solo y asegurarse de que todas estas variaciones conduzcan a la misma URL.

Compare la lista de URL rastreables y URL de análisis con Google Analytics
Este es el método más sencillo para localizar páginas huérfanas en un sitio web. Todo lo que tiene que hacer ahora es ir al área "Contenido del sitio" y hacer clic en "Todas las páginas" para recopilar todas las URL de su sitio web.
Las siguientes secciones aparecerán en la lista:
- URL de la página)
- Páginas vistas
- Visitas de página únicas
- Tiempo promedio en la página
- Rango de fechas
Para distinguir entre páginas normales y huérfanas, preste atención a las secciones Intervalo de fechas y Vistas de página.
Las páginas huérfanas están destinadas a tener las vistas de página más bajas porque no son accesibles para los usuarios. Simplemente haga clic en "Páginas vistas" para poner los sitios menos visitados al frente, y sus páginas huérfanas seguramente seguirán.
Otra alternativa es seleccionar "Rango de fechas" y especificar la fecha de inicio del filtro desde que se instaló Google Analytics. Debido a que Google Analytics solo puede mostrar 5000 URL a la vez, elija la mayor cantidad de filas en el área "Mostrar filas" en la parte inferior. Con toda probabilidad, esto cubrirá todas sus páginas huérfanas.
Después de que todas sus URL se hayan cargado en Google Analytics, haga clic en exportar para adquirir un archivo CSV o Excel de ellas. También puede usar la API de Google Analytics para ayudar a acelerar las cosas.
Solo necesita agregar las funciones requeridas para separar las URL rastreables de las URL de Analytics después de tener esta lista. Para tener una idea de lo que estoy hablando, mira la siguiente imagen:

Las URL huérfanas de la lista deben identificarse comparando la lista de URL de Analytics con la lista de URL rastreables. El último enlace en el ejemplo anterior, "https://xyz.com/7", es una página huérfana obvia. En la práctica, esta lista será bastante grande y tendrá que buscar en muchas más URL para descubrir la página huérfana.
Este proceso mecánico es fácil de automatizar. Para verificar si cada URL en la lista rastreable también está en la lista de análisis, use el algoritmo de coincidencia a continuación:
“=coincidencia(E2,$A$2:$A$11,0)”
Cuando la fórmula se arrastra a lo largo de la columna correspondiente, los signos de dólar le indican a la hoja que no cambie el rango. Además, el valor “0” le dice a Google que la lista no está ordenada.
Las coincidencias se restaurarán a la primera ubicación en el rango después de ejecutar este algoritmo. Debido a que no se detectaron en el campo Lista rastreable, los que no coincidan se devolverán con un error "#NA". Como ejemplo, "https://xyz.com/7" se mostraría con "#NA" de la siguiente manera:

Esto mostrará automáticamente todas las páginas huérfanas de la lista. Todo lo que tiene que hacer ahora es filtrar todos los resultados de #NA.
Aproveche la ayuda de otras herramientas para descubrir sus URL huérfanas
Hay una variedad de herramientas disponibles para ayudarlo a ubicar páginas huérfanas en su sitio web una vez que haya descubierto cómo hacerlo.
Las herramientas que proporcionan las mejores configuraciones y funciones para este propósito son las siguientes:
- Explorador de enlaces de Moz
- Ahrefs
- SEMrush
- Cuervo herramientas
Además de descubrir páginas huérfanas, todas estas herramientas brindan una profusión de capacidades que pueden ayudarlo con una variedad de otras tareas. Ahrefs, Moz y SEMrush son tres de las herramientas que pueden ayudarlo a encontrar páginas huérfanas mucho más rápidamente.
Otro beneficio es que estas herramientas descubrirán páginas en su sitio web que no se rastrean directamente y que no son necesariamente huérfanas. Esto puede ayudarlo a mejorar y generar valor a partir de estos sitios.
Desde el servidor, su equipo de desarrollo puede compilar rápidamente una lista de todas las URL de su sitio web. Todo lo que tiene que hacer es revisar los archivos de registro para obtener información sobre:
- ¿Quién es el que viene a su sitio web?
- ¿De dónde vienen cuando van al sitio web?
- ¿A qué páginas fueron?
Esta información lo ayudará en gran medida a ejecutar el segundo rastreo de todo su sitio web. Puede lograr esto ignorando directivas como "noindex" y "nofollow" y comparando los nuevos datos con los antiguos datos de rastreo para localizar las páginas huérfanas que se perdieron. La razón de esto es que los rastreadores a veces pueden acceder a páginas que desobedecen estas directivas, lo que da como resultado páginas huérfanas.
Busque la lista de URL en el informe de análisis de búsqueda de GSC después de haber completado esta operación. Quizás se pregunte si estas URL ya se han indexado. Sí, aunque algunas de estas páginas aún pueden ser inaccesibles a través de los enlaces internos de su sitio web. Estas páginas corren el riesgo de convertirse en páginas huérfanas en el futuro, pero puede evitar que esto suceda.
Reparación de páginas huérfanas: avance en el juego

Las páginas huérfanas pueden ser un problema importante para su sitio web, particularmente en términos de SEO. Veamos la siguiente etapa, que es arreglar las páginas huérfanas ahora que sabes cómo encontrarlas.
Cuando haya encontrado todas las páginas huérfanas de su sitio web, el siguiente paso es decidir cuáles vale la pena abordar y cuáles deben eliminarse. Las siguientes son las preguntas que debes hacerte para tomar esta decisión:
- ¿Dónde reside ahora la página en la taxonomía de su sitio web?
- ¿La página es útil para los visitantes? Si es así, ¿en qué parte de la arquitectura de su sitio web debe colocarse?
- ¿Es posible que la página se clasifique para alguna palabra clave? ¿Es posible optimizarlo para mejorar el SEO de tu web?
- ¿Es posible que la página tenga backlinks? ¿O la página tiene el potencial de ser enlazada desde otros sitios web?
- ¿El contenido de esta página es similar al de cualquiera de las otras?
Las respuestas a estas preguntas le ayudarán a decidir si desea mantener o eliminar las páginas huérfanas. También puede usar estos datos para calcular cuánto trabajo se necesitará para arreglar las páginas que conserva y cuánto valor proporcionarán.