O que é um Sitemap XML e como você pode criar um para SEO (com exemplos)

Publicados: 2022-01-25

XML Sitemap pequeno Sitemaps XML são uma das partes mais mal concebidas da equação de SEO.

Eu encontrei SEOs que não conseguiam explicar por que eles são necessários, muito menos dizer a você como configurar um “certo”.

Aqui está o atrito:

Assim como um mapa é essencial para encontrar seu destino por estrada, um sitemap XML é fundamental para que os mecanismos de pesquisa localizem os URLs do seu site.

Sem que seus URLs sejam rastreados, eles não serão indexados e suas páginas não serão classificadas (é claro) sem indexação.

Em suma, os sitemaps XML desempenham um papel crucial na otimização de mecanismos de pesquisa.

No post de hoje, mostrarei como criar um sitemap XML do zero e otimizá-lo perfeitamente para SEO, passo a passo. estou cobrindo:

  • O que é um mapa do site XML
  • Sitemaps XML vs. HTML
  • Tags de mapa do site XML (e quais você deve usar)
  • Exemplos de mapas do site XML
  • Por que você precisa de um sitemap XML
  • Como criar um mapa do site XML
  • Seis práticas recomendadas para criação de sitemap.xml

Sem mais delongas, vamos pular.

O que é um Sitemap XML? (E por que diabos você deveria se importar)

Em termos simples:

Um sitemap XML é um roteiro para os mecanismos de pesquisa.

Ele lista o conteúdo importante do seu site no formato XML, para que os mecanismos de pesquisa possam encontrar e indexar facilmente seu conteúdo e, por fim, exibi-lo nas páginas de resultados do mecanismo de pesquisa.

O que é um mapa do site XML

Você deve listar em seu sitemap XML qualquer página da web (ou arquivo) que deseja exibir nos mecanismos de pesquisa.

Por quê?

Porque um mapa do site garante que seu conteúdo seja descoberto.

Digamos que você tenha páginas da web que não estão vinculadas de qualquer lugar do seu site – ou da web em geral. Se essas páginas não tiverem hiperlinks apontando para elas, elas não serão encontradas pelos rastreadores da web.

Um mapa do site XML (enviado aos mecanismos de pesquisa) garante que os mecanismos de pesquisa possam encontrar as páginas que você deseja incluir nas SERPs.

Mas isso não é tudo.

Você pode usar um sitemap XML para fornecer informações adicionais aos mecanismos de pesquisa, como quando seu conteúdo foi atualizado pela última vez e quais páginas têm maior prioridade. Mais sobre isso mais tarde.

XML vs. HTML Sitemaps – Qual é a diferença?

Você pode adicionar dois tipos de sitemap ao seu site; um mapa do site XML e um mapa do site HTML.

  • Sitemaps XML usam linguagem de marcação extensível (XML)
  • Sitemaps HTML usam linguagem de marcação de hipertexto (HTML)
Mapa do site XML vs HTML

Mas além do código que eles usam, eles também servem a funções diferentes:

Mapa do site XML

Vamos começar com um exemplo de mapa de site XML:

Exemplo de mapa do site XML

Como você pode ver, os sitemaps XML não são amigáveis ​​para humanos.

Sitemaps XML são feeds projetados explicitamente para mecanismos de pesquisa.

Eles ajudam os mecanismos de pesquisa como o Google a compreender quais URLs rastrear e o que tem prioridade.

Além disso, com que frequência esses URLs mudam e quais novos foram adicionados ao site.

Frequência de rastreamento do sitemap XML

Essas informações ajudam os programadores de mecanismos de pesquisa a avaliar melhor quando e com que frequência rastrear novamente um URL específico.

Mapa do site HTML

Aqui está um exemplo de um sitemap HTML:

Exemplo de mapa do site HTML

Parece muito diferente de um sitemap XML.

Isso porque é uma página da web projetada para humanos – assim como para robôs.

Para humanos, um sitemap HTML ajuda a navegar melhor em um site.

Do ponto de vista de um mecanismo de pesquisa, um sitemap HTML é uma ferramenta útil para descoberta de URL (supondo que o sitemap esteja sendo rastreado e os links contidos no sitemap sejam seguidos).

Mas esse não é o único valor deles para SEO:

Os sitemaps HTML também distribuem o PageRank em todo o site.

Como os sitemaps HTML geralmente são vinculados a todas as páginas de um site (por meio de um link de navegação no rodapé), eles têm uma tonelada de PageRank fluindo para eles.

Rodapé do site

Isso significa que eles podem passar um monte de seu PageRank recebido para outras páginas do site por meio de links internos.

Tem uma página que está mal classificada?

Adicione essa página ao seu mapa do site HTML.

Pode ser uma maneira rápida e fácil de aumentar a classificação.

Como é um Sitemap XML?

Como já mencionei, os sitemaps XML são para mecanismos de pesquisa, não para humanos.

Eles certamente podem parecer confusos se você nunca encontrou um antes:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>

No entanto, quando você sabe o que cada um desses componentes significa:

  • Declaração XML
  • conjunto de URLs
  • URL
  • Última modificação
  • Prioridade
  • Mudar a frequência

Sitemaps XML são bastante diretos.

Vamos separar cada um:

Declaração XML

Em termos simples, a declaração XML informa aos mecanismos de pesquisa que eles estão lendo um arquivo XML.

 <?xml version="1.0" encoding="UTF-8"?>

A declaração XML também indica a versão XML e a codificação de caracteres usada.

  • A versão deve ser 1.0
  • A codificação deve ser UTF-8.

Coloque a declaração XML na parte superior do arquivo sitemap.xml.

Conjunto de URLs

O conjunto de URLs é um contêiner para todos os URLs no mapa do site.

Ele começa informando qual padrão de protocolo o sitemap.xml usa:

 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Você notará que o protocolo mencionado no exemplo acima é o padrão 0.9.

Google, Yahoo e Microsoft suportam este padrão de mapa de site – é o que eu recomendo que você use.

É importante observar que o urlset é fechado na parte inferior do documento XML:

 </urlset>

Este pequeno trecho de código informa aos mecanismos de pesquisa que o conjunto de URLs terminou.

URL

A tag <URL> é a tag pai de cada URL no sitemap XML:

 <url> <loc>https://seosherpa.com/services/</loc> </url> <url> <loc>https://seosherpa.com/services/</loc> </url>

Entre o <url> de abertura e o </url> de fechamento, você deve indicar a localização da URL em uma tag <loc> aninhada.

O que é crítico aqui é que você indique a URL absoluta, incluindo seu protocolo HTTP:// ou HTTPS://.

Em outras palavras, liste a URL exatamente como ela apareceria em um navegador da web.

URL no navegador

Por outro lado, URLs relativos como /services/ não serão reconhecidos.

A localização do URL é o único atributo que DEVE ser indicado entre as tags do URL.

Mas com isso dito, existem três propriedades adicionais (opcionais) que podem ser incluídas:

Última modificação

A tag <lastmod> determina quando o conteúdo nesse URL foi alterado pela última vez.

 <lastmod>2022-01-26T19:12:36+09:00</lastmod>

Digamos que você atualizou uma postagem no blog em 10 de janeiro de 2022; o atributo <lastmod> leria 2022-01-10.

Ele informa aos mecanismos de pesquisa quando o conteúdo desse URL foi revisado pela última vez, o que, em teoria , influencia quando um mecanismo de pesquisa rastreia novamente essa página.

Você também pode indicar a hora, mas é desnecessário.

Se você incluir apenas a data ou a hora, certifique-se de usar o formato “W3C datetime”.

É o único formato reconhecido para o tag <lastmod> em um sitemap.xml.

Prioridade

A tag <priority> especifica a prioridade do URL em relação a todos os outros URLs do site.

 <priority>0.8</priority>

Em outras palavras, ele permite que você informe aos mecanismos de pesquisa quais URLs devem ter precedência ao alocar o orçamento de rastreamento ao seu site.

Os valores de prioridade podem ser definidos de 0,0, que é a prioridade mais baixa, a 1,0, que é a máxima.

O problema é que o Google ignora o <priority> em sitemaps XML, porque nas palavras de Gary Illyes “é um saco de barulho”.

Portanto, não há realmente nenhum ponto em definir prioridade.

Mudar a frequência

Considerando que, a tag <lastmod> determina quando o conteúdo nesse URL foi alterado pela última vez…

A tag <changfreq> indica a frequência com que o conteúdo provavelmente será alterado.

 <changefreq>Daily</changefreq>

Seu objetivo é dar aos mecanismos de pesquisa uma ideia sobre a frequência com que eles podem querer rastrear novamente o URL.

A frequência de alteração em um sitemap XML pode ser definida para qualquer um dos seguintes valores:

  • sempre
  • de hora em hora
  • diário
  • semanalmente
  • por mês
  • anual
  • Nunca

Se a etiqueta foi definida como <changefreq>Semanalmente</changefreq> um mecanismo de pesquisa pode querer rastrear novamente esse URL a cada sete dias.

Fazer isso com mais frequência do que isso seria um desperdício, pois é improvável que o conteúdo varie.

No entanto, <changefreq> é obsoleto no que diz respeito ao Google:

Como a maioria dos geradores de sitemaps faz um péssimo trabalho ao combinar a tag <changefreq> com a frequência real da mudança, é fácil entender o porquê.

Você pode omitir o atributo de frequência de alteração de seu sitemap.xml.

Exemplos de Sitemap XML

Agora que sabemos o que faz um sitemap XML, vamos dar uma olhada em alguns exemplos de sitemap.xml como eles aparecem no mundo real.

Aqui está o mapa do site XML para as páginas do Gymshark:

Este mapa do site pode ser melhorado removendo <changefreq>, uma vez que é ignorado pelo Google, e adicionando uma declaração XML no início do XML do mapa do site.

(Incluir uma declaração XML é uma prática recomendada para todos os sitemaps).

Aqui está outro exemplo de mapa de site XML, desta vez de yaisland.ae

Exemplo de mapa do site XML

Assim como o mapa do site do Gym Shark, esse mapa do site pode ser aprimorado adicionando a declaração XML no início.

Além disso, a frequência de alteração e a prioridade podem ser removidas, pois são redundantes nos dias de hoje.

Fora isso, esses sitemaps XML estão configurados corretamente.

Então, nesta fase, você provavelmente está se perguntando:

Como é o mapa do site XML ideal?

Algo assim:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>

Deve conter:

  • Declaração XML (versão)
  • conjunto de URLs
  • URL(s)
  • Última modificação (somente data)
Exemplo de mapa do site XML

E, isso é realmente tudo.

Por que preciso de um Sitemap XML?

Como expliquei anteriormente, um mecanismo de pesquisa descobre conteúdo na Web rastreando de uma página da Web para outra usando bots geralmente chamados de “spiders”:

Rastreamento da aranha do mecanismo de pesquisa

Quando esses spiders descobrem uma nova página por meio de um link interno ou externo, eles adicionam essa página ao seu índice.

Mas o problema com o rastreamento?

Os mecanismos de pesquisa não podem encontrar todo o conteúdo da Web dessa maneira.

Se uma página da Web não estiver vinculada por meio de outra página conhecida, um mecanismo de pesquisa não a encontrará.

É aqui que entra um mapa do site XML.

Os sitemaps XML funcionam como um seguro para o rastreamento, informando aos mecanismos de pesquisa onde encontrar as páginas mais importantes do seu site, ajudando na descoberta e indexação de conteúdo.

Isso é fundamental porque os mecanismos de pesquisa não podem classificar seu conteúdo sem primeiro indexá-lo.

Que tipo de site precisa de um Sitemap XML?

Se você seguir o conselho do Google, os sitemaps XML são melhores para:

  • Sites grandes com milhares de páginas
  • Sites com arquivos extensos
  • Sites com muito conteúdo de mídia avançada
  • Sites com nenhum ou muito poucos backlinks

Mas aqui está a coisa:

Todos os sites se beneficiam de ter um sitemap XML.

Quando você inclui um mapa do site XML, os bots do mecanismo de pesquisa podem entender melhor a estrutura do seu site, descobrir seu conteúdo e saber quando ele foi atualizado pela última vez.

Mesmo se você tiver um site de página única, provavelmente vale a pena incluir um mapa do site XML.

Quais páginas você deve incluir em seu sitemap XML?

A resposta curta:

Inclua todas as páginas que você deseja exibir nos resultados de pesquisa em seu sitemap XML e deixe todo o resto de fora.

Em outras palavras, seu sitemap deve incluir apenas páginas que tenham utilidade. Coisas como:

  • Pagina inicial
  • Sobre a página
  • Páginas de produtos
  • Páginas de serviço
  • Página de contato
  • Postagens no blog

De um modo geral, você não incluiria páginas como:

  • Páginas de agradecimento
  • Páginas de tags
  • Arquivos de mídia privados

Todos esses são exemplos de URLs que você não gostaria que aparecessem nos resultados de pesquisa.

Inclusões XML do Sitemap

Mas lembre-se, só porque você omite uma página do seu sitemap não significa que ela não será indexada.

Se a página tiver links apontando para ela, há uma chance de que o Google (e outros mecanismos de pesquisa) rastreie, indexe e exiba essa página nos resultados do mecanismo de pesquisa.

Para garantir a remoção de uma página dos resultados de pesquisa, omita a página do mapa do site XML e adicione uma tag sem índice a ela.

E isso me leva ao meu próximo ponto:

Cada página em seu sitemap XML deve ser indexável.

Seu sitemap nunca deve conter páginas que retornem estes códigos de status:

  • 404 Página Não Encontrada
  • 301 ou 302 – Página movida para outro local

Os códigos de status 4XX e 3XX informam aos mecanismos de pesquisa que não há página lá.

E, se não houver página nessa URL, ela não é indexável.

Além disso:

Cada página deve ser acessível aos rastreadores do mecanismo de pesquisa.

Em resumo, o robots.txt não está bloqueando a página e não há diretivas (como meta robôs, links canônicos ou x-robots-tags) informando aos mecanismos de pesquisa para não indexar a página.

Agora que você sabe o que é incluído em um sitemap XML, vamos discutir como você cria um.

Como Criar um Sitemap XML (2 Metodologias)

Se você construiu seu site usando um sistema de gerenciamento de conteúdo como Shopify ou Wix, não precisa criar um sitemap XML, porque seu CMS gerará um sitemap para você.

O mapa do site XML nessas plataformas (e outras semelhantes) é atualizado automaticamente quando as páginas são adicionadas – ou removidas – do site.

Se o seu CMS não fizer isso, geralmente há um plug-in que fará isso por você.

Por outro lado, se você não estiver usando um CMS, precisará criar um sitemap XML manualmente.

Vamos decompor o processo:

Como criar um sitemap XML manualmente

Se você está preocupado em ter que codificar o sitemap XML manualmente, não se preocupe!

Este processo não é realmente manual.

Vamos usar o Screaming Frog para fazer a maior parte do trabalho para você.

O primeiro passo é instalar o Screaming Frog SEO Spider.

Dica – você pode usar a versão gratuita se o seu site tiver menos de trezentas páginas.

Uma vez instalado, navegue até 'Mode' e depois 'Spider'.

Em seguida, solte o URL da sua página inicial na caixa marcada 'Digite o URL para o spider'.

Em seguida, clique em 'Iniciar'.

O Screaming Frog começará a rastrear seu site.

Depois que o rastreamento for concluído, a seguir ajustamos algumas configurações:

Configurações do Sitemap do Screaming Frog

Como o Google não usa <changefreq> e <priority>, recomendo excluir essas tags do arquivo de mapa do site.

Também sugiro omitir <lastmod> do seu sitemap XML se você estiver criando um sitemap XML manualmente.

Por quê?

Porque é muito chato ter que reconstruir o mapa do site XML toda vez que você faz pequenas alterações em uma página.

Excluir <lastmod> do seu sitemap XML significa que você não precisa.

Antes de extrair o arquivo de mapa do site, você pode adicionar, editar ou excluir URLs, dependendo do que deseja que os mecanismos de pesquisa rastreiem e indexem.

Assim que terminar de ajustar seu sitemap, você pode carregá-lo para a pasta raiz do seu site, com “sitemap.xml” como seu nome de arquivo.

Bem simples, certo?

Como criar um Sitemap XML no WordPress

Pode ser uma surpresa, mas uma instalação “fora da caixa” do WordPress não vem com um criador de sitemap XML.

Para gerar um sitemap XML no WordPress, você precisará de um plugin, como o Yoast SEO.

Veja como adicionar o Yoast ao seu site, caso ainda não o tenha instalado:

Dentro do seu painel do WordPress, vá para 'Plugins' e depois 'Adicionar novo'.

Em seguida, procure por “Yoast SEO”.

Plugin Yoast SEO

Em seguida, clique em 'Instalar agora' no primeiro resultado e depois em 'Ativar'.

Depois que o Yoast estiver instalado, navegue até as configurações do Yoast e selecione 'SEO', depois 'XML Sitemaps' e depois 'Geral'.

Nesta guia, certifique-se de que 'A funcionalidade do mapa do site XML está definida como "ativada".

Com os sitemaps XML ativados, agora você deve ver o índice do seu sitemap em yourdomain.com/sitemap_index.xml.

Índice Yoast Sitemap

Felizmente, o Yoast exclui automaticamente páginas não indexáveis ​​(por exemplo, aquelas com meta-tag de robôs “sem índice”) de serem incluídas no mapa do site. Sendo assim, a configuração padrão deve funcionar bem na maioria dos casos.

Se desejar, no entanto, você pode optar por excluir certos tipos de postagem e taxonomias para otimizar ainda mais seu mapa do site:

Configuração do mapa do site Yoast XML

Para o site SEO Sherpa, excluí mídia e tags do meu mapa do site, porque, pelo menos no meu caso, essas páginas têm pouco valor para os usuários finais.

Como criar um Sitemap XML no Wix

Ao contrário do WordPress, o Wix possui a funcionalidade XML do sitemap integrada.

O problema é que é bastante limitado.

A única opção que você tem é excluir determinadas páginas.

Se você deseja excluir uma página, vá para a guia de configurações “SEO (Google)” da página e desative a opção “Mostrar esta página nos resultados da pesquisa”.

Configurações do mecanismo de pesquisa Wix

Isso adiciona uma metatag noindex à página E a exclui do mapa do site XML.

Um desafio com a funcionalidade rígida do sitemap do Wix é que ela inclui URLs que foram canonizadas para outra página.

Isso basicamente diz “classificar esta página” e “não classificar esta página” ao mesmo tempo, o que é super confuso para os mecanismos de pesquisa.

O resultado disso pode ser a versão errada aparecendo nas páginas de resultados de pesquisa.

Se você tem um site Wix, você pode encontrar o sitemap gerado automaticamente em yourdomain.com/sitemap.xml.

Como criar um Sitemap XML na Shopify

Você não precisa criar um sitemap XML se o seu site for construído com Shopify, isso é feito automaticamente para você.

Infelizmente, porém, não há personalização possível.

Com Shopify, você não pode nem excluir uma página do seu sitemap XML – tudo está incluído.

A única maneira de controlar o que aparece nos resultados da pesquisa é adicionar uma tag noindex diretamente aos arquivos .liquid.

Ainda assim, no Shopify, as páginas não indexadas serão exibidas no XML do mapa do site, o que, como apontamos anteriormente, não é o ideal.

Encontre seu sitemap em yourdomain.com/sitemap.xml.

Como enviar seu Sitemap para o Google

Até agora, você deve ter seu sitemap criado.

A etapa final (e possivelmente mais importante) é enviar seu mapa do site para o Google.

Claro, antes de fazer isso, você precisa saber onde seu sitemap está localizado.

Se você criou seu sitemap manualmente ou está usando Wix ou Shopify, seu sitemap pode ser encontrado no seguinte URL:

seudominio.com/sitemap.xml

Por outro lado, se seu site está no WordPress e você usou o Yoast para seu sitemap.xml, você encontrará o índice do sitemap neste URL:

seudominio.com/sitemap_index.xml

Se você estiver usando alguma outra plataforma - ou não conseguir encontrar seu mapa do site em nenhum desses locais, poderá verificar o mapa do site usando nossa ferramenta de classificação de SEO:

Avaliador de SEO

Depois de saber onde seu sitemap XML está localizado, vá para o Google Search Console e depois 'Sitemaps', que você encontrará no menu 'Index'.

Em seguida, cole o URL do seu mapa do site no campo do mapa do site e clique em “Enviar”.

Seu sitemap “deve” ser enviado com sucesso:

Sucesso no envio do mapa do site do Google Search Console

E, com isso, você está feito!

7 Práticas recomendadas para mapas de site XML “essenciais”

Vamos terminar com uma série de práticas recomendadas para mapas de site XML.

Você desejará executar essas técnicas para garantir que seu sitemap XML seja otimizado para rastreamento e indexação eficazes.

Vamos pular.

(1). Use um Sitemap dinâmico NÃO um Sitemap estático

Imagine ter que atualizar manualmente seu sitemap XML sempre que fizer alterações em seu site?!

Bem, isso é exatamente o que você teria que fazer com um sitemap estático.

Felizmente, a maioria dos CMS modernos possui a funcionalidade de mapa de site XML dinâmico embutida – ou disponível por meio de um plug-in.

Que significa:

Seu sitemap será atualizado automaticamente sempre que você adicionar, alterar ou remover páginas existentes.

Nenhuma intervenção manual é necessária.

O uso de um sitemap dinâmico é especialmente importante para sites grandes, onde as páginas prioritárias são adicionadas com frequência.

Certifique-se de usar um.

(2). Use o local e o nome padrão do Sitemap

Se você utilizar /my_website_sitemap.xml como o caminho para o seu sitemap XML, há uma chance de que os mecanismos de pesquisa não o encontrem.

Para garantir que seu sitemap seja facilmente descoberto, siga os locais padrão:

https://seudominio.com/sitemap.xml para sitemaps únicos

OU

https://yourdomain.com/sitemap_index.xml quando você tem vários sitemaps em um índice.

É simples assim.

(3). Referencie seu Sitemap XML em seu arquivo Robots.txt

Seu arquivo robots.txt é visitado por robôs de mecanismos de pesquisa quando eles iniciam o rastreamento do seu site.

Eles usam robots.txt para entender como rastrear o site.

Ao fazer referência ao seu sitemap XML dentro do arquivo robots.txt, você garante que os bots de pesquisa possam encontrá-lo.

Para adicionar seu sitemap XML ao robots.txt, abra o arquivo de texto robots e cole esta linha nele:

 Sitemap: https://www.yourdomain.com/sitemap.xml

Você pode encontrar o arquivo robots.txt no diretório raiz do seu servidor no caminho “/robots.txt”.

Se você tiver vários sitemaps XML, simplesmente liste-os um por um, assim:

 Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml

Embora, em teoria, você possa colocar a localização do mapa do site em qualquer lugar dentro do robots.txt, geralmente é melhor colocar no final:

Referência do mapa do site Robots txt

(4). Excluir páginas Noindex do seu Sitemap

O papel de um sitemap XML é informar aos mecanismos de pesquisa o que rastrear – e indexar.

Isso significa que apenas suas páginas dignas de classificação preferidas devem ser incluídas.

Adicionar páginas Noindex, não canônicas ou de redirecionamento ao seu sitemap confundirá os mecanismos de pesquisa e poderá afetar negativamente seu orçamento de rastreamento.

(5). Mantenha seu Sitemap XML abaixo de 50 MB

De acordo com o Google, um sitemap XML não deve exceder 50 MB ou 50.000 URLs.

Limite de tamanho de arquivo do Sitemap

Sempre que você exceder o limite de 50 MB ou 50.000 URLs, você deve dividir seu único Sitemap XML em vários arquivos de sitemap XML.

Ultrapassar esses limites pode levar o Google a interromper o rastreamento.

Por exemplo, você pode dividir seu sitemap em “posts” e “páginas”.

Em seguida, agrupe-os em um arquivo de índice do Sitemap.

(6). Ignorar Atributos de Prioridade e Changefreq

Como apontei anteriormente, o Google ignora essas duas tags:

  • <mudarfreq>
  • <prioridade>

Isso significa que, incluindo a frequência de alteração e os atributos de prioridade, apenas aumenta o peso desnecessário em seu sitemap, o que pode levar a problemas de indexação e orçamento de rastreamento.

Eu recomendo que você não use as tags <changefreq> ou <priority> em seu sitemap.

(7). Monitore o Google Search Console para erros de Sitemap XML

Se o Google não conseguir rastrear seu sitemap XML, ele informará por meio do Search Console:

Erros de mapa do site GSC

Os erros podem ser tão diretos quanto o URL do mapa do site XML que não pode ser obtido, para URLs enviados que retornam códigos de status 404 ou sem índice.

Os problemas mais frequentes tendem a ser:

(uma). URL enviado não encontrado (404)

Isso significa que um URL que você enviou no seu sitemap XML não existe.

Lembre-se, se você remover uma página do seu site, não se esqueça de removê-la do seu mapa do site. Melhor ainda, use um sitemap XML dinâmico e a URL será removida do seu sitemap automaticamente.

(b). URL enviado marcado como 'noindex'

Isso ocorre quando uma página em seu sitemap XML tem uma metatag 'noindex'.

Se você deseja que esta página seja indexada, você deve remover o metatag 'noindex'. Se você não quiser indexá-lo, remova-o do seu mapa do site.

De qualquer forma, ele precisa ser corrigido.

(c). URL enviado bloqueado por robots.txt

Isso ocorre quando uma página contida em seu sitemap XML é bloqueada pelo robots.txt.

Basicamente, há uma diretiva em seu arquivo robots.txt informando aos mecanismos de pesquisa para não rastrear a página, mesmo que você tenha solicitado que os mecanismos de pesquisa fizessem exatamente isso enviando-a para indexação.

Se você realmente deseja que o URL seja indexado, localize e remova a diretiva do arquivo robots.txt.

Ferramenta de teste de robôs TXT

Tente testar sua página usando o testador robots.txt para descobrir o culpado.

E aí está; sete melhores práticas de mapa de site XML.

O que você acha?

Agora eu gostaria de ouvir de você:

Qual técnica do post de hoje você vai usar primeiro?

Que mudanças você fará no seu sitemap XML como resultado da leitura do post de hoje?

Talvez você vá mudar de um sitemap manual para um XML automatizado? Ou talvez você vá omitir a tag <changefreq>?

De qualquer forma, deixe-me saber deixando um comentário abaixo.