Modelagem de tópicos em SEO – a nova maneira de classificar mais alto
Publicados: 2022-04-24A modelagem de tópicos em SEO é o uso de modelos estatísticos para descobrir tópicos em uma coleção de documentos. Ao examinar a coocorrência de palavras e frases em milhares de páginas, os algoritmos são capazes de atribuir relevância tópica a uma página e classificá-la em relação a uma consulta de pesquisa.

De palavras-chave a tópicos
Nos primórdios dos mecanismos de busca - no final da década de 1990 - os algoritmos faziam pouco mais do que combinar palavras-chave nos resultados com palavras-chave na consulta. Os mecanismos de pesquisa não entenderam o contexto da consulta ou a intenção por trás da palavra-chave.
Mas os motores de busca percorreram um longo caminho desde então. Os algoritmos do mecanismo de pesquisa agora entendem não apenas as palavras-chave, mas o tópico por trás das palavras-chave. Essa ênfase em tópicos em vez de palavras-chave é chamada de SEO semântico.
O primeiro grande avanço para entender os tópicos veio com o Google Hummingbird Update em 2013. Foi quando o Google começou a analisar frases inteiras, e não apenas palavras-chave individuais.
O próximo grande passo à frente veio em 2015 com o algoritmo RankBrain do Google, que usou processamento de linguagem natural (NLP) para entender o contexto e a intenção por trás das consultas de pesquisa.
A essa altura, a densidade de palavras-chave como medida de relevância estava desaparecendo rapidamente no espelho retrovisor. Ele estava sendo substituído por relevância tópica. O quão bem você classifica no Google agora depende de quão abrangente seu conteúdo cobre o tópico.
Desde então, o Google e outros mecanismos de pesquisa estão ficando cada vez melhores na compreensão dos tópicos. Eles fazem isso por meio de uma técnica chamada modelagem de tópicos.
Modelagem de Tópicos vs Classificação de Tópicos
A modelagem de tópicos é um método estatístico para descobrir as relações que existem entre palavras e frases.
Com a modelagem de tópicos, o algoritmo descobre as categorias de informações em si, sem supervisão. Ele faz isso digitalizando um conjunto de documentos e agrupando palavras e frases com base na frequência com que ocorrem ao lado de outras palavras e frases. A modelagem de tópicos é uma técnica de aprendizado 'não supervisionada': o algoritmo descobre as categorias por si mesmo, com base nos padrões que encontra.
A modelagem de tópicos é diferente da classificação de tópicos, que é uma técnica de aprendizado de máquina em que os humanos precisam 'treinar' o algoritmo, fornecendo certas regras.
Com a classificação de tópicos, primeiro você precisa definir as categorias de informações que deseja usar. Em seguida, você fornece ao algoritmo alguns exemplos de dados brutos que foram marcados com essas categorias predefinidas. O algoritmo então usa essas categorias pré-definidas para analisar os dados.
A diferença entre as duas técnicas é a seguinte: na classificação de tópicos, os humanos dizem ao algoritmo quais são as categorias, enquanto, na modelagem de tópicos, o algoritmo descobre quais são as categorias por meio da análise estatística de como palavras e frases se agrupam em determinados padrões.
Esses métodos de análise de texto estão sendo usados não apenas por mecanismos de pesquisa, mas também por toda a Internet.
Por exemplo, uma empresa que recebe grandes volumes de comentários de clientes on-line pode usar modelagem de tópicos ou classificação de tópicos para classificar seus comentários em categorias, como notificações pós-compra, acompanhamentos de experiências, comentários sobre fidelidade à marca, reclamações de clientes e avaliações de clientes.
Dois tipos de modelagem de tópicos
Até agora, tenho usado o termo 'modelagem de tópicos' como se fosse uma única coisa. Mas, na verdade, é um termo abrangente que abrange uma variedade de técnicas diferentes.
Vejamos agora alguns dos diferentes tipos de modelagem de tópicos.
Alocação de Dirichlet latente (LDA)
A Alocação de Dirichlet Latente (LDA) é baseada em duas suposições: que tópicos semelhantes fazem uso de palavras semelhantes e que documentos falam sobre vários tópicos para os quais uma distribuição estatística pode ser detectada.
O LDA mapeia documentos para uma lista de tópicos, atribuindo tópicos a arranjos de palavras, como n-grams. Um n-gram é uma sequência de palavras que são usadas no Processamento de Linguagem Natural.
O designador 'n' refere-se ao número de palavras no n-gram. Onde N=1, o n-gram contém uma palavra, onde N=2, o n-gram contém duas palavras e assim por diante.
Por exemplo, a frase “A vaca salta sobre a lua” conteria os seguintes n-gramas de 2 palavras (conhecidos como bi-gramas):
- a vaca
- vaca pula
- salta
- sobre o
- a lua
Depois de ter n-gramas, você pode fazer cálculos que preveem a probabilidade de certas palavras ocorrerem na mesma frase ou no mesmo parágrafo, ou a uma certa distância umas das outras.
A Alocação de Dirichlet Latente trabalha com a suposição de que os documentos consistem em arranjos particulares de palavras e que esses arranjos determinam o tópico do documento.
Análise semântica latente
Assim como a LDA, a análise semântica latente é baseada na hipótese distributiva: o significado das palavras pode ser apreendido observando os contextos em que as palavras aparecem. Como o linguista inglês, JR Firth colocou: “Você conhecerá uma palavra pela companhia que mantém” (Firth, JR 1957:11).
Ao contrário do LDA, que atribui tópicos a arranjos particulares de palavras, a análise semântica latente simplesmente calcula a frequência com que as palavras ocorrem em um conjunto de documentos. Assume-se que documentos pertencentes a tópicos semelhantes conterão aproximadamente a mesma distribuição de frequências de palavras para determinadas palavras.
O método que ele usa para calcular a frequência de palavras é Term Frequency-Inverse Document Frequency ou tf-idf.
Term Frequency (TF) refere-se ao número de vezes que uma palavra-chave aparece em um único documento.
Inverse Document Frequency (IDF), mede quantas vezes o termo aparece em uma coleção de documentos.
O Term Frequency (TF) é então dividido pela Inverse Document Frequency (IDF) para obter o valor TF-IDF.
Tanto o LDA quanto o LSA são técnicas não supervisionadas.
Clusters de tópicos - A chave para uma classificação mais alta
Como você pode ver, os mecanismos de pesquisa estão voltando sua atenção das palavras-chave para os tópicos. Eles estão usando vários métodos estatísticos para identificar padrões na maneira como certas palavras são encontradas com outras palavras. Esses padrões permitem que os mecanismos de pesquisa identifiquem tópicos.
E é por isso que os clusters de tópicos agora são uma parte vital da classificação alta nos resultados de pesquisa.
O Google quer fornecer resultados de pesquisa que sejam autoritários. Isso significa entregar conteúdo que cubra bem um tópico, tanto em profundidade quanto em amplitude.
Postagens de pilares e grupos de tópicos
A melhor maneira de fazer isso é usar o modelo de cluster de tópicos. Essa é uma coleção de páginas com uma página central chamada post pilar. O post pilar cobre o tópico em profundidade e geralmente tem pelo menos 3.000 palavras.
No post pilar, você cobre todos os subtópicos associados ao seu tópico. Mas você não necessariamente entra nesses subtópicos em grande detalhe. Passe alguns parágrafos apresentando cada subtópico e, em seguida, faça um link para uma postagem de blog separada, onde você aborda esse subtópico com mais detalhes.
Por exemplo, seu post pilar pode ser sobre 'ferramentas de jardim'. Isso seria um artigo mais longo do que a média, onde você descreve brevemente todos os principais tipos de ferramentas de jardim: cortadores de grama, aparadores de linha, aparadores de cerca viva, tesouras de poda, trituradores, sopradores de folhas, ferramentas de afiação, aspersores, etc.
Você então criaria um conteúdo separado para cada um desses subtópicos e vincularia a esses artigos da postagem do pilar.
Por que os clusters de tópicos ajudam no SEO?
Como um cluster de tópicos ajuda você a ter uma classificação mais alta? Ele mostra aos mecanismos de pesquisa que seu site tem autoridade tópica para um tópico específico. Ao criar um cluster de tópicos, seu conteúdo estará cheio de palavras-chave relacionadas. E é exatamente isso que os algoritmos dos mecanismos de busca estão procurando agora. Um site que tenha dez ou quinze páginas de conteúdo intimamente relacionado, cheio de palavras-chave que normalmente são encontradas juntas, receberá uma luz verde do algoritmo.
Até agora, neste artigo, vimos por que os tópicos estão substituindo as palavras-chave como foco do SEO e como os mecanismos de pesquisa usam várias ferramentas de modelagem de tópicos para entender os tópicos e seus subtópicos.
Como criador de conteúdo, você pode estar se perguntando se existem ferramentas de modelagem de tópicos que o ajudarão a 'mapear' um tópico específico para que você possa criar conteúdo que cubra esse tópico de forma abrangente.
Bem, não surpreendentemente, essas ferramentas já existem. E na próxima seção, vou mostrar dois deles.
Ferramentas de modelagem de tópicos
Esta seção oferece um passo a passo de duas ferramentas de modelagem de tópicos que ajudarão você a escrever conteúdo com alta autoridade tópica.
MarketMuse
MarketMuse é uma ferramenta de pesquisa de conteúdo e planejador de palavras-chave com inteligência artificial. Ele usa aprendizado de máquina e inteligência artificial para analisar conteúdo, sugerir tópicos a serem abordados e desenvolver resumos para ajudá-lo a criar um conteúdo melhor.
Ao fazer login no MarketMuse, você verá cinco ferramentas no menu à esquerda: Pesquisar, Competir, Otimizar, Perguntas e Conectar:

Vejamos essas ferramentas uma a uma.
A ferramenta de pesquisa
Na ferramenta de pesquisa, digite sua palavra-chave e o MarketMuse identificará os principais tópicos dessa palavra-chave:

Os tópicos aparecem na coluna da esquerda. Na coluna da direita, você verá o volume de pesquisa estimado para cada tópico relacionado, bem como um gráfico mostrando a tendência de pesquisa desse tópico.
A coluna na extrema direita mostra o número sugerido de vezes que você deve mencionar esse tópico relacionado em seu conteúdo. MarketMuse usa um código de cores para isso:
- Amarelo = 1 a 2 menções
- Verde = 3 a 10 menções
- Azul = mais de 10 menções
Você pode detalhar cada tópico relacionado clicando no tópico. Você verá uma lista de variantes para esse tópico:

Incluir essas variantes em seu conteúdo ajudará você a classificar várias palavras-chave. Isso também aumentará a autoridade tópica do seu artigo porque os mecanismos de pesquisa agora estão cientes de que certas palavras aparecem juntas em conteúdo que cobre um tópico em profundidade.
A ferramenta Competir
A ferramenta Compete cria um modelo de tópicos analisando milhares de documentos. Em seguida, analisa os 20 principais resultados em relação a esse modelo e apresenta os resultados como um mapa de calor.
Compete é usado para avaliar e analisar a concorrência de um determinado tópico e tomar decisões sobre a cobertura que você deseja ter para esse tópico.
O mapa de calor do Compete ajuda você a entender rapidamente como a concorrência aborda um assunto sobre o qual você deseja escrever, quais tópicos relacionados você precisa incluir e quais você deve abordar para destacar seu conteúdo da multidão:

Na parte superior da tela Competir, você verá os 20 principais resultados de pesquisa para esse tópico. Abaixo de cada resultado da pesquisa está a pontuação de conteúdo do MarketMuse para aquele artigo. Esta é uma pontuação proprietária desenvolvida pelo MarketMuse que mostra o quão bem a página cobre um tópico.
Os códigos de cores no mapa de calor mostram como cada parte do conteúdo cobre o tópico:
- Vermelho = 0 menções
- Amarelo = 1-2 menções
- Verde = 3-10 menções
- Azul = mais de 10 menções
Uma maneira rápida de avaliar o quão bem uma página cobre um tópico é varrer verticalmente uma coluna:

Da mesma forma, você pode ver como a concorrência cobre um tópico específico, digitalizando horizontalmente em uma linha:

Outra coisa a se procurar na ferramenta Compete são as pontuações de conteúdo. Isso permite que você veja rapidamente o quão bem o conteúdo de alto nível cobre esse tópico:

Se as pontuações forem baixas, isso é uma indicação de que você tem uma boa chance de obter uma classificação alta para esse tópico com um conteúdo bem pesquisado.

No lado esquerdo da tela Competir, você verá todos os tópicos que compõem o modelo de tópicos.
Ao usar a ferramenta Compete, há duas coisas a serem observadas: tópicos obrigatórios e lacunas de tópicos.
Tópicos obrigatórios são aqueles que são consistentemente encontrados entre as páginas mais bem classificadas nos resultados da pesquisa. Para um bom desempenho, esses tópicos devem ser incluídos em sua peça.
As lacunas de tópicos são tópicos que não são cobertos pela competição. Eles são uma excelente oportunidade para otimizar seu conteúdo, incluindo tópicos que seus concorrentes estão perdendo.
A ferramenta Otimizar
A ferramenta Otimizar é um editor de texto que fornece feedback em tempo real sobre como seu conteúdo abrange um tópico. Basta digitar sua palavra-chave e a URL do seu artigo e o MarketMuse mostrará

Os códigos de cores no painel direito mostram quantas vezes você usou esse termo e quantas vezes deveria usar esse termo.
À medida que você adiciona termos sugeridos ao seu conteúdo, os códigos de cores são atualizados para mostrar que você está se aproximando do número ideal de menções para esse termo.
A guia 'Feed' fornece uma avaliação contínua de quão bem seu conteúdo aborda os tópicos, à medida que você rola a página:

Na parte superior da tela Competir, você verá uma barra de status que informa sua pontuação de conteúdo, a pontuação média, sua pontuação alvo, sua contagem de palavras, a contagem média de palavras e sua contagem de palavras alvo:

A ferramenta de perguntas
A ferramenta Perguntas no MarketMuse é útil quando você está no estágio de pesquisa para escrever seu artigo. Ele mostra as perguntas mais frequentes relacionadas ao seu tópico:

Incluir perguntas relacionadas em seu conteúdo é outra maneira de aumentar a autoridade tópica do seu artigo.
No lado direito da tela, você verá uma coluna com um botão que diz “Run in”. Isso lhe dá a opção de executar cada pergunta em uma das outras quatro ferramentas:

O MarketMuse é uma ferramenta poderosa para analisar um tópico e garantir que o conteúdo de sua peça cubra o máximo possível do tópico. O que torna o MarketMuse particularmente útil é que ele se baseia nos resultados mais bem classificados para essa palavra-chave específica.
Ele não apenas mostra quais tópicos são cobertos pelas páginas classificadas no topo dos resultados da pesquisa. Ele também mostra as lacunas de tópicos. Ao abordar as lacunas de tópicos, você pode destacar seu conteúdo das outras páginas.
Informações do artigo
O Article Insights é outra ferramenta de modelagem de tópicos.
Ele ajuda você a identificar as palavras-chave que aparecem nos 10 principais resultados de pesquisa de um determinado tópico. Ele ajuda na análise de concorrentes, comparando seu conteúdo com o de seus concorrentes, para que você possa ver quais palavras-chave eles estão usando e você não. E ajuda na detecção de entidades marcando palavras-chave como pessoa, produto, empresa ou local.
A primeira coisa que você precisa fazer no Article Insights é criar um projeto. Dê um nome ao seu projeto e adicione a palavra-chave que você deseja segmentar:

A palavra-chave então entra em uma fila de processamento - pode levar alguns minutos para concluir a análise.
Depois que a palavra-chave for processada, você precisa clicar no botão Exibir.
Você verá uma tela que consiste em duas partes: a interface de escrita à esquerda e a análise à direita:

No editor de artigos, você tem duas abas: 'Artigo' e 'Breve':

Brief é onde você pode deixar notas sobre o artigo. Há um botão de compartilhamento onde você pode obter um link para compartilhar o artigo com seus escritores.
No lado direito está um painel com todas as análises do seu conteúdo:
Esses incluem:
- número de palavras
- palavras-chave que você usou em seu artigo
- palavras-chave que seus concorrentes usaram (análise de lacunas)
- títulos que você usou e o número de títulos que seus concorrentes usaram.
- exclusividade do seu conteúdo
- pontuação de legibilidade
Você pode começar a escrever seu artigo do zero ou importar um artigo em andamento de um URL:

Depois de carregar o conteúdo no editor de artigos, a ferramenta analisa seu conteúdo em relação aos 10 principais resultados de pesquisa para essa palavra-chave:

- Os painéis 1 e 2 mostram o quão completo é o seu artigo e o número de palavras que você deve buscar.
- O painel 3 mostra as 15 principais palavras-chave usadas em seu conteúdo.
- O painel 4 mostra as palavras-chave que seus concorrentes usaram e quantas delas você usou.
- O painel 5 mostra os títulos que você usou e os compara com os títulos usados por seus concorrentes.
Abaixo do painel Headings há um painel que mostra uma pontuação de 'Singularidade' e uma ferramenta que fornece uma pontuação de leitura Flesch:

A ferramenta 'singularidade' contém um botão chamado 'Artigo Re-escritor'.
Clique nele e ele abre o editor de artigos, com sugestões úteis de sinônimos que você pode usar para reescrever os trechos que você adicionou na guia 'pesquisa'. Passe o cursor sobre qualquer palavra destacada e a ferramenta oferece sinônimos alternativos para essa palavra:

Isso é muito útil que ajuda você a reescrever rapidamente seu conteúdo.
Na parte superior do painel direito há sete guias. Até agora, trabalhamos na guia Pontuação.
Se você clicar na guia Concorrentes, verá uma lista dos 10 principais concorrentes para essa palavra-chave, juntamente com um agrupamento de palavras-chave para cada concorrente. Esses agrupamentos de palavras-chave mostram as principais palavras-chave usadas por cada concorrente:

Você pode selecionar e desmarcar concorrentes, o que é útil se houver resultados que você acredita não serem relevantes para seu conteúdo.
A próxima guia é 'Pesquisa'. Esta guia extrai trechos de conteúdo de alto nível:

Clique em um trecho de pesquisa e ele será adicionado ao editor de artigos. Você então precisa reescrevê-lo para torná-lo parte de seu próprio conteúdo.
A próxima guia é 'Títulos'. Esta guia mostra os títulos usados para cada concorrente que você selecionou. Você pode ver exatamente quantos títulos eles têm em sua página e qual é o nível do título.

Em seguida é a guia 'Perguntas'.
Essa guia extrai perguntas do Google relacionadas à sua palavra-chave principal. Estes são subtópicos que você pode adicionar ao seu artigo para ganhar autoridade tópica:

A próxima guia é 'Tópicos'. Esta ferramenta mostra palavras-chave relacionadas, agrupadas em tópicos. Os parágrafos correspondentes a esses tópicos são colocados nesse painel de tópicos para você:

O esboço do tópico ajuda você a descobrir palavras-chave relacionadas que você pode adicionar facilmente aos seus parágrafos. Adicionar essas palavras relacionadas ao seu parágrafo aumentará a autoridade tópica do seu conteúdo e melhorará drasticamente a qualidade do seu artigo.
A última guia é 'Duplicados'. Essa ferramenta detecta fragmentos em seu conteúdo que são duplicados. Você precisa reescrever qualquer coisa marcada em vermelho por esta ferramenta.
Vamos voltar agora ao painel de palavras-chave na guia 'Pontuação' porque ele tem um recurso útil. Clique em uma palavra-chave nesse painel:

Essa palavra-chave será destacada na guia Concorrente. Você pode ver quantas vezes seus concorrentes usaram essa palavra-chave:

Essa mesma palavra-chave também será destacada na guia 'Pesquisa':

Esse é um recurso útil quando você está tentando otimizar seu conteúdo para uma palavra-chave específica.
Conclusão
À medida que os algoritmos se afastam do foco em palavras-chave e tentam entender os tópicos, torna-se cada vez mais importante que seu conteúdo abranja um tópico de forma abrangente.
Isso está se tornando a chave para a classificação no topo dos resultados de pesquisa.
Neste artigo, examinamos várias técnicas de modelagem de tópicos que os mecanismos de pesquisa estão usando agora para entender melhor a co-ocorrência de palavras em um documento e em um conjunto de documentos.
Vimos como a presença, a frequência e a proximidade de palavras-chave semelhantes em um documento estão sendo usadas pelos mecanismos de pesquisa para entender os tópicos.
É lógico que, se os mecanismos de pesquisa estiverem usando essas ferramentas para entender a autoridade tópica, os criadores de conteúdo precisam usar as mesmas técnicas para garantir que seu conteúdo cubra um tópico adequadamente.
E é aí que entram ferramentas como MarketMuse e Article Insights. Eles usam IA para analisar o tópico sobre o qual você está escrevendo e mostrar quais são os subtópicos desse tópico e quais palavras-chave você deve usar para classificar bem esse tópico.
Recursos relacionados
- Clusters de tópicos e SEO – 5 dicas fáceis para criar hubs de conteúdo
- SEO semântico - um guia para iniciantes
- Crie uma estrutura de silo em seu site em 5 etapas fáceis
- O que é indexação semântica latente: 7 fatos importantes
- O que são palavras-chave LSI e como usá-las para obter uma classificação mais alta