Páginas órfãs: como encontrá-las e corrigi-las para melhorar o SEO

Publicados: 2022-09-11

O que é uma Página Órfã?

What is an Orphan Page
O que é uma página órfã

Uma página órfã é uma página em um site que não possui links apontando para ela. Essas páginas não são acessíveis porque não têm conexões internas que os rastreadores ou usuários possam utilizar para acessá-las enquanto navegam em seu site.

Como alguns sites ocultam suas páginas de destino de propósito, as páginas órfãs são frequentemente apresentadas com uma tag de "aviso" em vez de uma tag de "erro".

Sites órfãos não serão encontrados pelos motores de busca, e é por isso que é fundamental verificar o seu site para eles. Isso se deve à maneira como o Google descobre novas páginas da Web em um site:

  • Os rastreadores reconhecem os URLs das páginas mencionadas no mapa do site XML.
  • Os rastreadores procuram URLs vinculados a outro site interno ou externo.

Se você quiser que uma página da Web seja indexada e encontrada pelos mecanismos de pesquisa, será necessário procurar páginas órfãs em seu site e executar as etapas apropriadas.

As Páginas Órfãs são um problema de SEO?

Are Orphan Pages an SEO issue
As Páginas Órfãs são um problema de SEO

Quando um mecanismo de pesquisa não consegue encontrar uma página por meio de links, geralmente é ignorado. Mesmo que sua página da Web esteja incluída no mapa do site XML do seu site, ainda pode ser um problema para o SEO:

  • Sites órfãos podem incluir informações desatualizadas, diminuindo a autoridade de seu domínio.
  • Durante o processo de migração do site, as páginas ficam frequentemente órfãs. Isso é um problema porque as páginas órfãs podem ter conteúdo útil que pode ajudá-lo a melhorar seus rankings.
  • Mais páginas órfãs em seu site podem confundir os mecanismos de pesquisa em relação ao contexto do seu conteúdo, diminuindo assim suas classificações de SERP.

Páginas órfãs versus páginas sem saída

Orphan Pages vs. Dead End Pages
Páginas órfãs versus páginas sem saída

É crucial entender a diferença entre páginas sem saída e páginas órfãs.

O termo “órfão” refere-se a páginas que não estão conectadas ou acessíveis a partir de outras páginas. As páginas sem saída, por outro lado, não estão vinculadas a nenhum site externo ou interno para rastreadores ou pessoas explorarem. Como resultado, um “beco sem saída” é criado, daí o termo.

Quando um usuário acessa uma página sem saída, ele tem duas opções: abandonar o site ou retornar. Os rastreadores de mecanismos de pesquisa, da mesma forma, são incapazes de transmitir qualquer valor de link porque não têm para onde ir de páginas sem saída.

Embora qualquer página sem saída possa ser corrigida simplesmente adicionando links ao conteúdo ou adicionando barras laterais/navegação de rodapé, as páginas órfãs são diferentes. Vejamos como localizar e corrigir páginas órfãs.

LEIA TAMBÉM: Impacto do Marketing na Sociedade

Como encontrar páginas órfãs em um site?

Obtenha uma lista dos URLs do seu site

Encontrar páginas órfãs é uma tarefa demorada e às vezes impossível para os rastreadores. Como resultado, o uso de uma ferramenta de SEO seria um desafio porque depende de dados coletados por rastreadores.

A melhor técnica para detectar uma página órfã é usar um relatório do Google Analytics para compilar uma lista de todos os URLs do seu site. Você pode fazer isso facilmente com qualquer outro software de análise de sua escolha.

A página aparecerá no relatório do Analytics se já tiver sido visualizada. Há um registro do URL em algum lugar e, se você observar a parte de visualizações de página do relatório, poderá encontrá-lo facilmente.

Resolver problemas de duplicação de página

É possível que o motivo mais prevalente das páginas órfãs nem seja algo que você considere. A duplicação de páginas é um problema frequentemente negligenciado e deve ser tratado imediatamente. Cada página duplicada deve redirecionar apenas para um URL e, se isso não acontecer, as versões dessa página certamente não serão conectadas. Como resultado, elas podem se tornar páginas órfãs.

O fato de essas páginas serem duplicadas é a preocupação fundamental nesta circunstância. Ao procurar páginas órfãs em seu site como parte de uma auditoria de site, esse deve ser o primeiro local a ser examinado. Há dois tipos de duplicação de página a serem observados:

1. Páginas não canônicas

Non Canonical Pages
Páginas não canônicas

Os protocolos https ou http, bem como www ou não www nas URLs, devem ser usados ​​de forma consistente em cada página do seu site.

Como resultado, você deve examinar cada uma de suas páginas públicas colocando todas as variações de suas páginas no navegador, como esta:

  • https://www.xyz.com
  • http://www.xyz.com
  • https://xyz.com
  • http://xyz.com

Todas essas versões devem levar os leitores à mesma página, com a mesma URL. As páginas da web se tornarão canônicas para si mesmas como resultado disso. Se alguma dessas variações não redirecionar a pesquisa para a página da Web apropriada, você deve estar ciente de que pode estar lidando com um problema comum. Você também deve verificar outros sites, qualquer que seja a variação que esteja causando o problema.

2. Barras à direita

Trailing Slashes
Barras à direita

Este é mais um pequeno detalhe para ficar de olho que pode ter uma influência significativa. Se você não usar barras à direita de forma consistente em seu site, algumas de suas páginas podem ficar órfãs. Vejamos outro cenário:

  • https://example.com/page1/
  • https://example.com/page1

Esses URLs podem fornecer o mesmo conteúdo aos visitantes, mas seus URLs são distintos.

Verifique suas páginas da web para essas duas versões para determinar se os usuários estão sendo enviados para a mesma página. Certifique-se de que isso seja feito de maneira uniforme em todas as suas páginas da web. Você pode usar “.htaccess” para fazer esse procedimento cuidar de si mesmo e garantir que todas essas variações levem ao mesmo URL.

Compare a lista de URLs rastreáveis ​​e URLs do Analytics usando o Google Analytics

Este é o método mais direto para localizar páginas órfãs em um site. Tudo o que você precisa fazer agora é ir até a área “Conteúdo do Site” e clicar em “Todas as Páginas” para coletar todas as URLs do seu site.

As seguintes seções aparecerão na lista:

  • URL da página)
  • Visualizações de página
  • Visualizações de página únicas
  • Tempo médio na página
  • Período

Para distinguir entre páginas normais e órfãs, preste atenção às seções Intervalo de datas e Visualizações de página.

As páginas órfãs são destinadas a ter as visualizações de página mais baixas porque não são acessíveis aos usuários. Basta clicar em “Pageviews” para colocar os sites menos visitados na frente, e suas páginas órfãs certamente seguirão.

Outra alternativa é selecionar “Date Range” e especificar a data de início do filtro desde a instalação do Google Analytics. Como o Google Analytics só pode exibir 5.000 URLs por vez, escolha o maior número de linhas na área "Mostrar linhas" na parte inferior. Muito provavelmente, isso cobrirá todas as suas páginas órfãs.

Depois que todos os seus URLs forem carregados no Google Analytics, clique em exportar para adquirir um arquivo CSV ou Excel deles. Você também pode usar a API do Google Analytics para ajudar a acelerar as coisas.

Você só precisa adicionar as funções necessárias para separar os URLs rastreáveis ​​dos URLs do Analytics depois de ter essa lista. Para ter uma noção do que estou falando, veja a imagem abaixo:

crawable urls
URLs rastreáveis

Os URLs órfãos na lista devem ser identificados comparando a lista de URLs do Google Analytics com a lista de URLs rastreáveis. O último link no exemplo acima, “https://xyz.com/7,” é uma página órfã óbvia. Na prática, essa lista será bem grande e você terá que pesquisar muito mais URLs para descobrir a página órfã.

Este processo mecânico é simples de automatizar. Para verificar se cada URL da lista Rastreável também está na lista do Analytics, use o algoritmo de correspondência abaixo:

“=correspondência(E2,$A$2:$A$11,0)”

Quando a fórmula é arrastada ao longo da coluna relevante, os cifrões informam à planilha para não alterar o intervalo. Além disso, o valor “0” informa ao Google que a lista não está ordenada.

As correspondências serão restauradas para o primeiro local no intervalo após a execução deste algoritmo. Como não foram detectados no campo Lista Rastreável, os que não corresponderem serão retornados com um erro “#NA”. Como exemplo, “https://xyz.com/7” seria exibido com “#NA” da seguinte forma:

orphan pages
páginas órfãs

Isso exibirá automaticamente todas as páginas órfãs da lista para você. Tudo o que você precisa fazer agora é filtrar todos os resultados #NA.

Conte com a ajuda de outras ferramentas para descobrir seus URLs órfãos

Há uma variedade de ferramentas disponíveis para ajudá-lo a localizar páginas órfãs em seu site depois de descobrir como fazê-lo.

As ferramentas que fornecem as melhores configurações e funções para esta finalidade são as seguintes:

  • Explorador de links do Moz
  • Ahrefs
  • SEMrush
  • Ferramentas Raven

Além de descobrir páginas órfãs, todas essas ferramentas fornecem uma profusão de recursos que podem ajudá-lo em várias outras tarefas. Ahrefs, Moz e SEMrush Opens in a new tab. são três das ferramentas que podem ajudá-lo a encontrar páginas órfãs muito mais rapidamente.

Outro benefício é que essas ferramentas descobrirão páginas em seu site que não estão sendo rastreadas diretamente e não são necessariamente órfãs. Isso pode ajudá-lo a melhorar e gerar valor a partir desses sites.

A partir do servidor, sua equipe de desenvolvimento pode compilar rapidamente uma lista de todas as URLs do seu site. Tudo o que você precisa fazer é examinar os arquivos de log para obter informações sobre:

  • Quem é que vem ao seu site?
  • De onde eles vêm quando acessam o site?
  • Para quais páginas eles foram?

Essas informações o ajudarão muito na execução do segundo rastreamento de todo o seu site. Você pode conseguir isso desconsiderando diretivas como “noindex” e “nofollow” e comparando os novos dados com os dados de rastreamento antigos para localizar páginas órfãs que foram perdidas. A razão para isso é que os rastreadores às vezes podem acessar páginas que desobedecem a essas diretivas, resultando em páginas órfãs.

Procure a lista de URLs no relatório Search Analytics do GSC depois de concluir esta operação. Você pode estar se perguntando se esses URLs já foram indexados. Sim, embora algumas dessas páginas ainda possam estar inacessíveis por meio dos links internos do seu site. Essas páginas correm o risco de se tornarem páginas órfãs no futuro, mas você pode evitar que isso aconteça.

Corrigindo Páginas Órfãs – Avance no jogo

Fixing Orphan Pages
Corrigindo Páginas Órfãs

As páginas órfãs podem ser um problema significativo para o seu site, principalmente em termos de SEO. Vejamos o próximo estágio, que é corrigir páginas órfãs agora que você sabe como localizá-las.

Quando você encontrar todas as páginas órfãs do seu site, o passo a seguir é decidir quais valem a pena abordar e quais devem ser eliminadas. A seguir estão as perguntas que você deve se fazer para tomar essa decisão:

  1. Onde a página agora reside na taxonomia do seu site?
  2. A página é útil para os visitantes? Se sim, onde na arquitetura do seu site ele deve ser colocado?
  3. É possível que a página seja classificada para qualquer palavra-chave? É possível otimizá-lo para melhorar o SEO do seu site?
  4. É possível que a página tenha backlinks? Ou a página tem potencial para ser vinculada a outros sites?
  5. O conteúdo desta página é semelhante ao de qualquer uma das outras?

As respostas a essas perguntas o ajudarão a decidir se deve ou não manter ou excluir as páginas órfãs. Você também pode usar esses dados para descobrir quanto trabalho será necessário para corrigir as páginas que você preserva e quanto valor elas fornecerão.