Optimización avanzada en la página: más allá de la densidad de palabras clave: TF-IDF para SEO
Publicado: 2021-02-26Todos sabemos que la optimización de motores de búsqueda (SEO) no es nueva. Ahora es un campo bien establecido y con muchas facetas que ha sufrido muchos cambios. La forma cambiante en que los motores de búsqueda evalúan y clasifican las páginas ha dado lugar a muchos de esos giros y vueltas en el SEO (echa un vistazo a este artículo sobre el costo del SEO).
La construcción de enlaces es otra cosa que saltó a la fama significativa. Eso sucedió una vez que quedó clara la importancia de los backlinks. El SEO más técnico pasó a primer plano cuando la arquitectura de la información de cualquier sitio se reconoció como un factor crucial.
La importancia del contenido entonces se hizo evidente. Los motores de búsqueda hicieron saber que los sitios deben tener contenido relevante y de alta calidad. Al principio, eso llevó a los profesionales de SEO a buscar su densidad de palabras clave y sus herramientas de planificación de palabras clave. En poco tiempo, se hizo evidente que ese no era el mejor camino a seguir. O al menos, que usar esas herramientas para prácticas turbias como el relleno de palabras clave no iba a funcionar. No engañaría a los algoritmos de los motores de búsqueda.
Google y otros motores de búsqueda buscan contenido real de alta calidad. Recompensan el contenido que es realmente relevante para su supuesto tema y que responde a la intención deseada del usuario. La creación de dicho contenido fue el principal consejo de Google para recuperarse de su famosa, o infame, actualización médica.
Reserve una consulta
Como resultado, es obvio que Google y otros motores de búsqueda pueden evaluar y evaluar con precisión el tema y el significado del contenido. Una forma en que hacen esto es empleando tf-idf. Tf-idf es uno de los factores de clasificación más antiguos utilizados por los motores de búsqueda. En su nivel más simple, les permite entender de qué tratan las páginas.
Esta guía definitiva de tf-idf para SEO le brindará toda la información que pueda necesitar. Cubrirá qué es tf-idf y cómo funciona, cómo se relaciona tf-idf con el SEO y cómo y cuándo puede utilizar el análisis de tf-idf.
¿Qué es TF-IDF?
Tf-idf es una estadística numérica utilizada en la recuperación de información. Representa la importancia de una palabra o frase para un documento dado, en comparación con otros documentos en una colección o 'corpus'. Un valor tf-idf aumenta proporcionalmente al número de veces que aparece una palabra o frase en un documento.
Luego, eso se compensa con la cantidad de veces que esa palabra o frase aparece en todos los documentos del corpus. Esto es importante ya que se ajusta al hecho de que algunas palabras aparecen con más frecuencia en el uso general.
Tomemos el ejemplo de un término de búsqueda como 'el mejor SEO'. 'El' es una palabra que aparecería muchas veces en todos los documentos de un corpus. Como resultado, es menos importante para un valor td-idf si aparece 'el' en el documento buscado que si aparecen otras palabras menos comunes.
Tf-idf es el producto de dos estadísticas. Lo que significa que multiplicas uno por el otro. Así es como representa la importancia de una palabra o frase y compensa la frecuencia general de esa palabra o frase. Las dos estadísticas son Frecuencia de término (tf) y Frecuencia de documento inversa (idf).
Plazo Frecuencia
La frecuencia del término es la mitad más simple de tf-idf. Representa la frecuencia con la que aparece un término en un documento determinado. Todo lo que se necesita para calcular la frecuencia de los términos es la longitud de las palabras del documento y el número de veces que aparece el término. A continuación, divide el número de veces que aparece la palabra por el recuento total de palabras. Eso significa que la frecuencia del término siempre será un valor entre cero y uno.
Al nivel más simple posible, la frecuencia de los términos se calcula de la siguiente manera:
TF (Frecuencia del término) = t (Número de veces que aparece el término en un documento) / d (total de palabras en el documento)
Al considerar la longitud del documento y la cantidad de veces que aparece el término, obtendrá una idea clara de qué tan relevante es el documento para el término dado. Sin embargo, no puede estar seguro, a menos que sepa con qué frecuencia aparece el término en los documentos en general. Ahí es donde entra en juego la frecuencia inversa del documento (idf).
Frecuencia de documento inversa
Las palabras que se usan con mucha frecuencia en muchos documentos no son buenas para determinar qué documentos son relevantes para un término de búsqueda específico. La frecuencia inversa del documento es una estadística que reduce el peso que se le da a esos términos comunes.
Garantiza que si está buscando 'el rápido zorro marrón', 'el' que aparece muchas veces en un documento, no importará tanto como si las otras palabras están presentes. La frecuencia inversa del documento es una medida de la cantidad de información que proporciona una palabra o un término.
La fórmula para calcular idf parece bastante complicada:
IDF = registro (Nd / fi)
Si lo descompones en sus partes, no es tan complejo.
Log es simplemente una función matemática que no es demasiado importante de entender. Simplemente puede presionar el botón 'registro' en una calculadora si alguna vez lo necesita. 'Nd' es el número de documentos en la colección o corpus que se busca. 'fi' es el número de esos documentos que contienen el término de búsqueda.
Obtiene su valor IDF, luego, dividiendo el número de documentos por el número de documentos con el término de búsqueda y luego aplicando la función de registro.
Ejemplo resuelto de TF-IDF
Ahora podemos tomar lo que hemos aprendido y usarlo para un ejemplo muy simple. Digamos que tiene un documento de 100 palabras y busca la palabra "palabra clave". Si esa palabra aparece tres veces, puedes calcular la frecuencia del término de la siguiente manera:
3 (número de términos en el documento) / 100 (total de palabras) = 0,03
Su frecuencia de término es 0.03. Ahora digamos que hay un total de diez millones de documentos en el corpus que busca y 'palabra clave' aparece en 1.000 de ellos. Ahora tiene todo lo que necesita para calcular su idf:
Registro (10,000,000 / 1,000) = 4
Su frecuencia de documento inversa es 4. Un valor tf-idf es simplemente la frecuencia del término multiplicada por idf, entonces:
0,03 (tf) x 4 (idf) = 0,12
Su valor tf-idf es 0.12. Eso por sí solo no dice mucho, pero se puede comparar con otros valores. Cuanto mayor sea el valor de tf-idf, más significativo es un término para el documento dado. Los valores más altos de tf-idf se obtienen cuando hay una alta frecuencia de términos y un bajo número de documentos que incluyen el término en un corpus. La siguiente tabla debería ayudar a demostrar esto:
Plazo Frecuencia (TF) | Tamaño del cuerpo (Nd) | Documentos con Término (fi) | Frecuencia de documento inversa (IDF) | TF-FDI |
0.03 | 10,000,000 | 1,000 | 4 | 0.12 |
0.04 | 10,000,000 | 900 | 4.05 | 0.162 |
0.05 | 10,000,000 | 800 | 4.10 | 0.205 |
0.06 | 10,000,000 | 700 | 4.15 | 0.249 |
0.07 | 10,000,000 | 600 | 4.22 | 0.295 |
TF-IDF, SEO y LSI
Tf-idf se usa con mayor frecuencia como parte de la indexación semántica latente (LSI). Esto es ciertamente lo que conecta directamente tf-idf y SEO. LSI con tf-idf es una técnica para procesar lenguaje. Permite clasificar los documentos en función de su relevancia para un término de búsqueda individual o un área temática más amplia.
LSI funciona mediante la identificación de patrones en las relaciones entre diferentes frases y conceptos en colecciones de texto no estructuradas. Se basa en la idea de que las palabras utilizadas en los mismos contextos tienden a tener significados relacionados o similares.
Al establecer los patrones entre términos y frases, LSI permite discernir el tema general o tema de un cuerpo de texto. Cuando se aplica LSI con tf-idf a un corpus de documentos, una consulta o término de búsqueda arrojará resultados más precisos.

Esto se debe a que los resultados incluirán documentos conceptualmente similares en significado a la búsqueda. Ese será el caso incluso si los documentos no contienen palabras específicas del término de búsqueda. El objetivo de LSI con tf-idf es dar sentido a los temas y enfoques reales de un corpus de documentos.
En resumen, tf-idf, cuando se usa como parte de LSI, permite que las máquinas comprendan de qué se tratan las páginas de texto. Por lo tanto, es la forma en que Google y otros motores de búsqueda pueden evaluar la relevancia y la utilidad del contenido.
La importancia de tf-idf para SEO ciertamente se está volviendo más clara. Es uno de los primeros factores de clasificación de los motores de búsqueda e incluso puede verse como un componente clave de los motores de búsqueda y las SERP. Más importante aún, tf-idf ayuda a Google a evaluar la relevancia real y la utilidad de las páginas en relación con cualquier término de búsqueda o consulta.
Eso plantea la pregunta de cómo nuestra mejor comprensión de tf-idf puede usarse para SEO. Ya sea por una agencia de SaaS SEO o por el propietario de una pequeña empresa que busca aumentar el tráfico orgánico. AJ Ghergich expresó su opinión en un video de SEMrush sobre el tema:
'El objetivo general de tf-idf es medir estadísticamente la importancia de una palabra en una colección de documentos. Es como una herramienta de densidad de palabras clave muy útil con esteroides.'
SEMrush
Esa es una pequeña analogía ordenada, pero podría ser un poco engañosa. El análisis Tf-idf no se utiliza mejor para identificar palabras clave para insertar en el contenido. Es mejor pensar en ello como una especie de herramienta de inspiración de contenido.
El uso de tf-idf para comparar su propio contenido con páginas similares que se clasifican mejor puede brindarle sugerencias sobre cómo enriquecer el contenido. Apuntará a palabras clave y frases para las cuales el contenido de mayor clasificación obtiene mejores valores tf-idf que sus páginas.
Eso mostrará qué áreas temáticas y temas no cubre su contenido con tanto detalle o páginas similares. Luego, tiene una hoja de ruta sobre cómo mejorar su contenido de una manera que seguramente le gustará a Google. Eso es mejorando su relevancia y qué tan bien satisface la intención de los posibles lectores que buscan palabras clave o frases en particular.
Usando TF-IDF para SEO
El uso de TF-IDF para SEO no se trata de densidad de palabras clave. Va mucho más allá de eso.
Realizar un análisis tf-idf revela términos y frases que su contenido no trata tan bien como otras páginas. Entonces, su próximo paso no es comenzar a insertar esas frases dentro de su contenido existente para aumentar la densidad de palabras clave. Lo que desea hacer es optimizar su contenido para que sea más relevante para los temas y temas que rodean esas frases.
Por ejemplo, podría tener una página con SEO como tema principal. Un análisis tf-idf puede revelar que tiene menos valor para el término 'construcción de enlaces' que otras páginas que ocupan un lugar destacado en las búsquedas de SEO. Eso te dice que tu contenido no brinda suficiente información relevante y útil sobre la construcción de enlaces. Tan simple como eso, tienes una forma definitiva de mejorar tu contenido.
Antes de que pueda pensar en mejorar su contenido, necesita saber cómo realizar un análisis tf-idf. Abordemos eso ahora mismo.
Cómo completar un análisis TF-IDF
Es técnicamente posible ejecutar un análisis tf-idf a mano, realizando sus propios cálculos. Si bien es posible, no se recomienda. Como ya ha visto, los cálculos pueden complicarse un poco y siempre llevarán tiempo.
Ese ni siquiera es el mayor problema. Un análisis tf-idf solo vale la pena si el corpus con el que compara el contenido es relevante y útil. Desea poder comparar los valores tf-idf de su contenido con otras páginas que califican bien para sus palabras clave importantes. Ahí es donde entra en juego una herramienta tf-idf, como la que ofrece Ryte.
La herramienta de Ryte puede comparar una URL activa de su sitio con los diez primeros resultados de búsqueda de Google para una determinada palabra clave o consulta de búsqueda. A continuación, proporcionará una lista de términos y frases relacionados importantes para los que el contenido de alta clasificación tiene un alto valor tf-idf.
Además de eso, la herramienta de Ryte también calificará la URL elegida con respecto a esas frases y términos. Mostrará si su contenido tiene valores tf-idf tan altos, más altos o más bajos para cada uno de ellos.
Esa información le mostrará dónde y cómo debe mejorar su contenido. Le dará los temas y asuntos que su página no cubre de manera suficientemente eficiente. Por lo tanto, podrá adaptar la página para que se adapte mejor a las necesidades e intenciones de sus lectores.
Probablemente ahora se esté preguntando cuándo debería usar el análisis tf-idf. Hay muchas otras cosas que también deben hacerse, después de todo, dentro y fuera del campo del SEO.
Cuándo usar el análisis TF-IDF
Nunca es un mal momento para pensar en mejorar el contenido de su sitio. También hay tantas horas en el día. Eso significa que es mejor implementar el análisis tf-idf en las circunstancias en las que es más probable que marque la diferencia. Hay un puñado de ejemplos de tales circunstancias;
- Desbloqueo del potencial del contenido existente
Tf-idf puede ser realmente útil si tiene una página que se clasifica constantemente en la segunda página de las búsquedas de Google. Habiendo llegado tan alto en los rankings, la página claramente tiene potencial. Un análisis tf-idf puede ayudarlo a determinar los ajustes y adiciones exactos que necesita para dar el último salto a la página uno.
- Guía de un nuevo plan de contenido
Un análisis tf-idf es excelente como inspiración para el contenido. Realizar un análisis en las páginas que se clasifican bien para ciertos temas y temas le mostrará lo que su propio contenido debe cubrir. Esa puede ser una excelente base para esbozar un plan para una gran cantidad de contenido nuevo.
- Detener las clasificaciones en declive
Si tiene una página que solía tener un rendimiento superior pero que está bajando en la clasificación de palabras clave importantes, tf-idf también puede ayudarlo. Puede mostrarle para qué palabras clave y temas las páginas que superan a las suyas obtienen mejores valores tf-idf. A continuación, puede mejorar y actualizar su propio contenido en consecuencia.
TF-IDF para SEO: ir más allá de la densidad de palabras clave
Hay mucho que considerar en el mundo moderno del SEO. La arquitectura del sitio, los enlaces, la densidad de palabras clave y todos esos otros elementos tradicionales siguen siendo cruciales. Sin embargo, se puede argumentar que el contenido es ahora el rey. O al menos que se le debe prestar tanta atención como a cualquiera de esos otros factores.
Los sitios ya no pueden salirse con la suya con el relleno de palabras clave o con el llenado de páginas con contenido de spam duplicado u oculto. Los sitios deben contener contenido de alta calidad que sea realmente útil para los lectores. Tf-idf es una forma importante en la que Google y otros motores de búsqueda evalúan el contenido en ese sentido.
Por lo tanto, es crucial comprender cómo funciona tf-idf y cómo se relaciona con el SEO. Una comprensión e implementación adecuadas de tf-idf para SEO puede ayudarlo a enriquecer su contenido y ver las recompensas en su tráfico orgánico.
Reserve una consulta

Nick Brown es el fundador y director ejecutivo de la agencia de aceleración, una agencia de SEO SaaS. Nick ha lanzado varios negocios en línea exitosos, escribe para Forbes, publicó un libro y ha crecido aceleradamente de una agencia del Reino Unido a una empresa que ahora opera en EE. UU., APAC y EMEA y emplea a 160 personas. Una vez también fue atacado por un gorila de montaña.