Modelado de temas en SEO: la nueva forma de clasificar más alto

Publicado: 2022-04-24

El modelado de temas en SEO es el uso de modelos estadísticos para descubrir temas en una colección de documentos. Al examinar la coincidencia de palabras y frases en miles de páginas, los algoritmos pueden asignar relevancia temática a una página y clasificar la página frente a una consulta de búsqueda.

Topic Modeling In SEO – A Beginner’s Guide

Tabla de contenido
De palabras clave a temas
Modelado de temas frente a clasificación de temas
Dos tipos de modelado de temas
Asignación latente de Dirichlet (LDA)
Análisis semántico latente
Grupos de temas: la clave para una clasificación más alta
Publicaciones de pilares y grupos de temas
¿Por qué los grupos de temas ayudan con el SEO?
Herramientas de modelado de temas
MercadoMuse
La herramienta de investigación
La herramienta Competir
La herramienta Optimizar
La herramienta Preguntas
Información del artículo
Conclusión
Recursos Relacionados

De palabras clave a temas

En los primeros días de los motores de búsqueda, a finales de la década de 1990, los algoritmos hacían poco más que hacer coincidir las palabras clave de los resultados con las palabras clave de la consulta. Los motores de búsqueda no entendieron el contexto de la consulta o la intención detrás de la palabra clave.

Pero los motores de búsqueda han recorrido un largo camino desde entonces. Los algoritmos de los motores de búsqueda ahora entienden no solo las palabras clave, sino también el tema detrás de las palabras clave. Este énfasis en los temas en lugar de las palabras clave se denomina SEO semántico.

El primer gran avance hacia la comprensión de los temas se produjo con Google Hummingbird Update en 2013. Fue entonces cuando Google comenzó a analizar frases completas, y no solo palabras clave individuales.

El siguiente gran paso adelante se produjo en 2015 con el algoritmo RankBrain de Google, que utilizó el procesamiento de lenguaje natural (NLP) para comprender el contexto y la intención detrás de las consultas de búsqueda.

En ese momento, la densidad de palabras clave como medida de relevancia estaba desapareciendo rápidamente en el espejo retrovisor. Estaba siendo reemplazada por relevancia tópica. Su clasificación en Google ahora depende de qué tan integralmente cubra el tema su contenido.

Desde entonces, Google y otros motores de búsqueda han ido mejorando cada vez más en la comprensión de los temas. Lo hacen a través de una técnica llamada modelado de temas.

Modelado de temas frente a clasificación de temas

El modelado de temas es un método estadístico para descubrir las relaciones que existen entre palabras y frases.

Con el modelado de temas, el algoritmo descubre las categorías de información por sí mismo, sin supervisión. Para ello, escanea un conjunto de documentos y agrupa palabras y frases en función de la frecuencia con la que aparecen junto con otras palabras y frases. El modelado de temas es una técnica de aprendizaje 'no supervisada': el algoritmo descubre las categorías por sí mismo, basándose en los patrones que encuentra.

El modelado de temas es distinto de la clasificación de temas, que es una técnica de aprendizaje automático en la que los humanos tienen que "entrenar" el algoritmo dándole ciertas reglas.

Con la clasificación de temas, primero debe definir las categorías de información que desea utilizar. Luego le da al algoritmo algunos ejemplos de datos sin procesar que han sido etiquetados con esas categorías predefinidas. Luego, el algoritmo usa esas categorías predefinidas para analizar los datos.

La diferencia entre las dos técnicas es esta: en la clasificación de temas, los humanos le dicen al algoritmo cuáles son las categorías, mientras que, en el modelado de temas, el algoritmo descubre cuáles son las categorías a través del análisis estadístico de cómo las palabras y frases se agrupan en ciertos patrones.

Estos métodos de análisis de texto están siendo utilizados no solo por los motores de búsqueda, sino también en Internet.

Por ejemplo, una empresa que recibe un gran volumen de comentarios de los clientes en línea puede utilizar el modelado de temas o la clasificación de temas para clasificar sus comentarios en categorías, como notificaciones posteriores a la compra, seguimientos de experiencias, comentarios de lealtad a la marca, quejas de clientes y reseñas de clientes.

Dos tipos de modelado de temas

Hasta ahora, he estado usando el término 'modelado de temas' como si fuera una sola cosa. Pero en realidad es un término genérico que cubre una variedad de técnicas diferentes.

Veamos ahora algunos de los diferentes tipos de modelado de temas.

Asignación latente de Dirichlet (LDA)

La asignación latente de Dirichlet (LDA) se basa en dos supuestos: que temas similares utilizan palabras similares y que los documentos hablan de varios temas para los que se puede detectar una distribución estadística.

LDA asigna documentos a una lista de temas asignando temas a arreglos de palabras como n-gramas. Un n-grama es una secuencia de palabras que se utilizan en el procesamiento del lenguaje natural.

El designador 'n' se refiere al número de palabras en el n-grama. Donde N=1, el n-grama contiene una palabra, donde N=2, el n-grama contiene dos palabras, y así sucesivamente.

Por ejemplo, la oración "La vaca salta sobre la luna" contendría los siguientes n-gramas de 2 palabras (conocidos como bi-gramas):

  • la vaca
  • vaca salta
  • salta por encima
  • sobre el
  • la luna

Una vez que tenga n-gramas, puede hacer cálculos que predicen la probabilidad de que ciertas palabras aparezcan en la misma oración o en el mismo párrafo, o a cierta distancia entre sí.

La asignación latente de Dirichlet funciona bajo la suposición de que los documentos consisten en arreglos particulares de palabras y que esos arreglos determinan el tema del documento.

Análisis semántico latente

Al igual que LDA, el análisis semántico latente se basa en la hipótesis distributiva: el significado de las palabras se puede comprender observando los contextos en los que aparecen las palabras. Como dijo el lingüista inglés JR Firth: “Conocerás una palabra por la compañía que tiene” (Firth, JR 1957:11).

A diferencia de LDA, que asigna temas a arreglos particulares de palabras, el análisis semántico latente simplemente calcula con qué frecuencia ocurren las palabras en un conjunto de documentos. Asume que los documentos que pertenecen a temas similares contendrán aproximadamente la misma distribución de frecuencias de palabras para ciertas palabras.

El método que utiliza para calcular la frecuencia de palabras es Frecuencia de término-Frecuencia de documento inversa o tf-idf.

La frecuencia de términos (TF) se refiere al número de veces que aparece una palabra clave en un solo documento.

Frecuencia inversa de documentos (IDF), mide cuántas veces aparece el término en una colección de documentos.

Luego, la frecuencia de término (TF) se divide por la frecuencia de documento inversa (IDF) para obtener el valor de TF-IDF.

Tanto LDA como LSA son técnicas no supervisadas.

Grupos de temas: la clave para una clasificación más alta

Como puede ver, los motores de búsqueda están desviando su atención de las palabras clave a los temas. Están utilizando varios métodos estadísticos para identificar patrones en la forma en que ciertas palabras se encuentran con otras palabras. Esos patrones permiten que los motores de búsqueda identifiquen temas.

Y es por eso que los grupos de temas ahora son una parte vital de la clasificación alta en los resultados de búsqueda.

Google quiere ofrecer resultados de búsqueda que sean autorizados. Eso significa entregar contenido que cubra bien un tema, tanto en profundidad como en amplitud.

Publicaciones de pilares y grupos de temas

La mejor manera de hacerlo es utilizar el modelo de grupo de temas. Esa es una colección de páginas con una página central llamada publicación pilar. La publicación pilar cubre el tema en profundidad y suele tener al menos 3000 palabras.

En la publicación pilar, cubre todos los subtemas asociados con su tema. Pero no necesariamente entras en esos subtemas en gran detalle. Dedique algunos párrafos a presentar cada subtema y luego enlace a una publicación de blog separada donde cubra ese subtema con más detalle.

Por ejemplo, su publicación pilar podría ser sobre 'herramientas de jardín'. Ese sería un artículo más largo que el promedio en el que describa brevemente todos los tipos principales de herramientas de jardín: cortadoras de césped, cortadoras de hilo, cortadoras de setos, tijeras de podar, trituradoras, sopladores de hojas, herramientas para bordear, aspersores, etc.

Luego, crearía una pieza separada de contenido para cada uno de esos subtemas y vincularía esos artículos desde la publicación principal.

¿Por qué los grupos de temas ayudan con el SEO?

¿Cómo te ayuda un grupo de temas a clasificar más alto? Muestra a los motores de búsqueda que su sitio web tiene autoridad temática para un tema en particular. Cuando crea un grupo de temas, su contenido estará lleno de palabras clave relacionadas. Y eso es exactamente lo que buscan ahora los algoritmos de los motores de búsqueda. Un sitio web que tiene diez o quince páginas de contenido estrechamente relacionado lleno de palabras clave que normalmente se encuentran juntas obtendrá luz verde del algoritmo.

Hasta ahora, en este artículo, hemos analizado por qué los temas están reemplazando a las palabras clave como enfoque de SEO y cómo los motores de búsqueda utilizan varias herramientas de modelado de temas para comprender los temas y sus subtemas.

Como creador de contenido, es posible que se pregunte si existen herramientas de modelado de temas que lo ayudarán a "trazar un mapa" de un tema en particular para que pueda crear contenido que cubra ese tema de manera integral.

Bueno, no es sorprendente que tales herramientas ya existan. Y en la siguiente sección, les mostraré dos de ellos.

Herramientas de modelado de temas

Esta sección le brinda un recorrido por dos herramientas de modelado de temas que lo ayudarán a escribir contenido con una alta autoridad temática.

MercadoMuse

MarketMuse es una herramienta de planificación de palabras clave y de investigación de contenido impulsada por IA. Utiliza aprendizaje automático e inteligencia artificial para analizar contenido, sugerir temas para cubrir y desarrollar resúmenes para ayudarlo a crear mejor contenido.

Cuando inicie sesión en MarketMuse, verá cinco herramientas en el menú de la izquierda, Investigar, Competir, Optimizar, Preguntas y Conectar:

MarketMuse tools

Veamos estas herramientas una por una.

La herramienta de investigación

En la herramienta de investigación, escriba su palabra clave y MarketMuse identificará los temas principales para esa palabra clave:

MarketMuse research tool

Los temas aparecen en la columna de la izquierda. En la columna de la derecha, verá el volumen de búsqueda estimado para cada tema relacionado, así como un gráfico que muestra la tendencia de búsqueda de ese tema.

La columna en el extremo derecho le muestra la cantidad sugerida de veces que debe mencionar ese tema relacionado en su contenido. MarketMuse usa un código de color para esto:

  • Amarillo = 1 a 2 menciones
  • Verde = 3 a 10 menciones
  • Azul = 10+ menciones

Puede profundizar en cada tema relacionado haciendo clic en el tema. Verá una lista de variantes para ese tema:

MarketMuse research tool

Incluir estas variantes en su contenido lo ayudará a clasificar para múltiples palabras clave. También aumentará la autoridad temática de su artículo porque los motores de búsqueda ahora saben que ciertas palabras aparecen juntas en el contenido que cubre un tema en profundidad.

La herramienta Competir

La herramienta Competir crea un modelo de tema analizando miles de documentos. Luego analiza los 20 mejores resultados contra ese modelo y presenta los resultados como un mapa de calor.

Compete se utiliza para evaluar y analizar la competencia de un tema determinado y tomar decisiones sobre la cobertura que desea tener para ese tema.

El mapa de calor de Compete lo ayuda a comprender rápidamente cómo la competencia aborda un tema sobre el que desea escribir, qué temas relacionados debe incluir y cuáles debe cubrir para que su contenido se destaque entre la multitud:

marketMuse compete tool

En la parte superior de la pantalla Competir, verá los 20 mejores resultados de búsqueda para ese tema. Debajo de cada resultado de búsqueda se encuentra la puntuación de contenido de MarketMuse para ese artículo. Esta es una puntuación patentada desarrollada por MarketMuse que muestra qué tan bien la página cubre un tema.

Los códigos de color en el mapa de calor le muestran qué tan bien cada pieza de contenido cubre el tema:

  • Rojo = 0 menciones
  • Amarillo = 1-2 menciones
  • Verde = 3-10 menciones
  • Azul = 10+ menciones

Una forma rápida de evaluar qué tan bien una página cubre un tema es escanear verticalmente hacia abajo una columna:

use MarketMuse to check the topical authority of competing content

Del mismo modo, puede ver cómo la competencia cubre un tema en particular escaneando horizontalmente una fila:

MarketMuse compete tool

Otra cosa que debe buscar en la herramienta Competir son las puntuaciones de contenido. Estos le permiten ver de un vistazo qué tan bien el contenido de mayor rango cubre ese tema:

using content scores in MarketMuse

Si los puntajes son bajos, es una indicación de que tiene una buena oportunidad de obtener una clasificación alta para ese tema con un contenido bien investigado.

En el lado izquierdo de la pantalla Competir, verá todos los temas que componen el modelo de tema.

Al usar la herramienta Competir, hay dos cosas que debe buscar: temas imprescindibles y lagunas en los temas.

Los temas imprescindibles son aquellos que se encuentran constantemente entre las páginas de mayor rango en los resultados de búsqueda. Para un buen desempeño, estos temas deben incluirse en su pieza.

Las brechas temáticas son temas que no están cubiertos por la competencia. Son una excelente oportunidad para optimizar tu contenido al incluir temas que tus competidores están perdiendo.

La herramienta Optimizar

La herramienta Optimize es un editor de texto que le brinda comentarios en tiempo real sobre qué tan bien su contenido cubre un tema. Simplemente escriba su palabra clave y la URL de su artículo y MarketMuse mostrará

MarketMuse optimize tool

Los códigos de color en el panel de la derecha le muestran cuántas veces ha usado ese término y cuántas veces debería usar ese término.

A medida que agregue términos sugeridos a su contenido, los códigos de color se actualizarán para mostrar que se está acercando al número óptimo de menciones para ese término.

La pestaña 'Feed' le brinda una evaluación continua de qué tan bien su contenido aborda los temas, a medida que se desplaza hacia abajo en la página:

using the MarketMuse optimize tool

En la parte superior de la pantalla Competir, verá una barra de estado que le indica su puntaje de contenido, el puntaje promedio, su puntaje objetivo, su conteo de palabras, el conteo promedio de palabras y su conteo de palabras objetivo:

MarketMuse word count and status bar

La herramienta Preguntas

La herramienta Preguntas en MarketMuse es útil cuando se encuentra en la etapa de investigación para escribir su artículo. Te muestra las preguntas más frecuentes relacionadas con tu tema:

MarketMuse questions tool

Incluir preguntas relacionadas en su contenido es otra forma de aumentar la autoridad temática de su artículo.

En el lado derecho de la pantalla, verá una columna con un botón que dice "Ejecutar". Esto le da la opción de ejecutar cada pregunta en una de las otras cuatro herramientas:

MarketMuse questions tool

MarketMuse es una herramienta poderosa para analizar un tema y garantizar que el contenido de su pieza cubra la mayor parte posible del tema. Lo que hace que MarketMuse sea particularmente útil es que se basa en los mejores resultados para esa palabra clave en particular.

No solo le muestra qué temas están cubiertos por las páginas que se clasifican en la parte superior de los resultados de búsqueda. También le muestra las lagunas temáticas. Al abordar las brechas de temas, puede hacer que su contenido se destaque de las otras páginas.

Información del artículo

Article Insights es otra herramienta de modelado de temas.

Le ayuda a identificar las palabras clave que aparecen en los 10 primeros resultados de búsqueda para un tema en particular. Ayuda con el análisis de la competencia al comparar su contenido con el de sus competidores para que pueda ver qué palabras clave están usando y usted no. Y ayuda con la detección de entidades al etiquetar palabras clave como persona, producto, empresa o lugar.

Lo primero que debe hacer en Article Insights es crear un proyecto. Asigne un nombre a su proyecto y luego agregue la palabra clave que desea orientar:

Article Insights topic modeling tool

Luego, la palabra clave entra en una cola de procesamiento; puede llevar unos minutos completar el análisis.

Una vez procesada la palabra clave, debe hacer clic en el botón Ver.

Luego verá una pantalla que consta de dos partes: la interfaz de escritura a la izquierda y el análisis a la derecha:

Article Insights AI content tool

En el editor de artículos, tienes dos pestañas: 'Artículo' y 'Resumen':

Article and Brief buttons

Breve es donde puede dejar notas sobre el artículo. Hay un botón para compartir donde puede obtener un enlace para compartir el artículo con sus escritores.

En el lado derecho hay un panel con todos los análisis de su contenido:

Éstos incluyen:

  • número de palabras
  • palabras clave que ha utilizado en su artículo
  • palabras clave que han utilizado sus competidores (análisis de brechas)
  • encabezados que ha utilizado y el número de encabezados que han utilizado sus competidores.
  • singularidad de su contenido
  • puntaje de legibilidad

Puede comenzar a escribir su artículo desde cero, o puede importar un artículo en progreso desde una URL:

Article Insights import content

Una vez que haya cargado el contenido en el editor de artículos, la herramienta analiza su contenido contra los 10 mejores resultados de búsqueda para esa palabra clave:

Article Insights Score tab
  • Los paneles 1 y 2 le muestran qué tan completo está su artículo y la cantidad de palabras que debe buscar.
  • El panel 3 le muestra las 15 palabras clave principales utilizadas en su contenido.
  • El panel 4 te muestra las palabras clave que han usado tus competidores y cuántas de ellas has usado tú.
  • El panel 5 le muestra los títulos que ha utilizado y los compara con los títulos utilizados por sus competidores.

Debajo del panel Encabezados hay un panel que muestra un puntaje de 'Singularidad' y una herramienta que le brinda un puntaje de lectura de Flesch:

Article Insights unique content tool

La herramienta de 'exclusividad' contiene un botón llamado 'Reescritor de artículos'.

Haga clic en eso y se abre el editor de artículos, con sugerencias útiles para sinónimos que puede usar para volver a escribir los fragmentos que agregó desde la pestaña 'investigación'. Pase el cursor sobre cualquier palabra resaltada y la herramienta le dará sinónimos alternativos para esa palabra:

Article Insights re-writer tool

Esto es muy útil y te ayuda a reescribir rápidamente tu contenido.

A lo largo de la parte superior del panel de la derecha hay siete pestañas. Hasta ahora, hemos estado trabajando en la pestaña Puntuación.

Si hace clic en la pestaña Competidores, verá una lista de los 10 principales competidores para esa palabra clave, junto con una agrupación de palabras clave para cada competidor. Estos grupos de palabras clave le muestran las principales palabras clave utilizadas por cada competidor:

Article Insights competitors tab

Puede seleccionar y anular la selección de competidores, lo cual es útil si hay resultados que cree que no son relevantes para su contenido.

La siguiente pestaña es 'Investigación'. Esta pestaña extrae fragmentos del contenido de mayor rango:

Article Insights research tab

Haga clic en un fragmento de investigación y se agregará al editor de artículos. Luego debe volver a escribirlo para que forme parte de su propio contenido.

La siguiente pestaña es 'Títulos'. Esta pestaña muestra los encabezados utilizados para cada competidor que seleccionó. Puede ver exactamente cuántos encabezados tienen en su página y qué nivel es el encabezado.

Article Insights headings tab

La siguiente es la pestaña 'Preguntas'.

Esta pestaña extrae preguntas de Google que están relacionadas con su palabra clave principal. Estos son subtemas que puede agregar a su artículo para ganar autoridad temática:

Article Insights questions tab

La siguiente pestaña es 'Temas'. Esta herramienta le muestra palabras clave relacionadas, agrupadas en temas. Los párrafos que coinciden con esos temas se colocan en ese panel de temas por usted:

Article Insights topics tab

El esquema del tema lo ayuda a descubrir palabras clave relacionadas que puede agregar fácilmente a sus párrafos. Agregar estas palabras relacionadas a su párrafo aumentará la autoridad temática de su contenido y mejorará drásticamente la calidad de su artículo.

La última pestaña es 'Duplicados'. Esta herramienta detecta fragmentos dentro de su contenido que son duplicados. Debe volver a escribir cualquier cosa marcada en rojo por esta herramienta.

Volvamos ahora al panel de palabras clave en la pestaña 'Puntuación' porque tiene una función útil. Haga clic en una palabra clave en ese panel:

Article Insights

Esa palabra clave se resaltará en la pestaña Competidor. Luego puede ver cuántas veces sus competidores han usado esa palabra clave:

Article Insights

Esa misma palabra clave también se resaltará en la pestaña "Investigación":

Article Insights research tab

Esta es una función útil cuando intenta optimizar su contenido para una palabra clave en particular.

Conclusión

A medida que los algoritmos dejan de centrarse en las palabras clave y tratan de comprender los temas, se vuelve cada vez más importante que su contenido cubra un tema de manera integral.

Eso se está convirtiendo en la clave para posicionarse en la parte superior de los resultados de búsqueda.

En este artículo, hemos analizado varias técnicas de modelado de temas que los motores de búsqueda utilizan ahora para comprender mejor la coexistencia de palabras dentro de un documento y dentro de un conjunto de documentos.

Hemos visto cómo los motores de búsqueda utilizan la presencia, la frecuencia y la proximidad de palabras clave similares dentro de un documento para comprender los temas.

Es lógico que si los motores de búsqueda utilizan estas herramientas para comprender la autoridad del tema, los creadores de contenido deben utilizar las mismas técnicas para asegurarse de que su contenido cubra un tema correctamente.

Y ahí es donde entran herramientas como MarketMuse y Article Insights. Usan IA para analizar el tema sobre el que está escribiendo y mostrarle cuáles son los subtemas dentro de ese tema y qué palabras clave debe usar para clasificar bien para ese tema.

Recursos Relacionados

  • Grupos de temas y SEO: 5 consejos sencillos para crear centros de contenido
  • SEO semántico: una guía para principiantes
  • Cree una estructura de silo en su sitio web en 5 sencillos pasos
  • Qué es la indexación semántica latente: 7 hechos importantes
  • ¿Qué son las palabras clave de LSI y cómo usarlas para obtener una clasificación más alta?