Ottimizzazione on-page avanzata – Oltre la densità delle parole chiave: TF-IDF per SEO
Pubblicato: 2021-02-26Sappiamo tutti che l'ottimizzazione per i motori di ricerca (SEO) non è una novità. Ora è un campo consolidato e dalle molte sfaccettature che ha subito molti cambiamenti. Il modo mutevole in cui i motori di ricerca valutano e classificano le pagine ha portato a molti di questi colpi di scena nel SEO (dai un'occhiata a questo articolo sul costo del SEO).
La creazione di link è un'altra cosa che ha raggiunto un'importanza significativa. Ciò è accaduto una volta che l'importanza dei backlink è diventata chiara. Una SEO più tecnica è emersa quando l'architettura informativa di un dato sito è stata riconosciuta come un fattore cruciale.
L'importanza del contenuto è quindi diventata evidente. I motori di ricerca hanno reso noto che i siti dovrebbero avere contenuti pertinenti e di alta qualità. All'inizio, ciò ha portato i professionisti SEO a correre per la loro densità di parole chiave e strumenti di pianificazione delle parole chiave. In breve tempo, divenne evidente che quella non era la strada migliore da percorrere. O almeno, che l'utilizzo di quegli strumenti per pratiche losche come il keyword stuffing non avrebbe funzionato. Non ingannerebbe gli algoritmi dei motori di ricerca.
Google e altri motori di ricerca sono alla ricerca di contenuti reali di alta qualità. Premiano i contenuti che sono veramente rilevanti per il loro presunto argomento e che rispondono all'intento desiderato dell'utente. La creazione di tali contenuti è stato il consiglio principale di Google per riprendersi dal loro famoso – o famigerato – aggiornamento medico.
Prenota una consulenza
Di conseguenza, è ovvio che Google e altri motori di ricerca possono valutare e valutare accuratamente l'oggetto e il significato del contenuto. Un modo in cui lo fanno è impiegando tf-idf. Tf-idf è uno dei più antichi fattori di ranking utilizzati dai motori di ricerca. Al suo livello più semplice, consente loro di capire di cosa trattano le pagine.
Questa guida definitiva a tf-idf per SEO ti fornirà tutte le informazioni di cui potresti aver bisogno. Tratterà cos'è tf-idf e come funziona, come tf-idf si collega alla SEO e come e quando è possibile utilizzare l'analisi tf-idf.
Cos'è TF-IDF?
Tf-idf è una statistica numerica utilizzata nel recupero delle informazioni. Rappresenta quanto sia importante una parola o una frase per un dato documento, rispetto ad altri documenti in una raccolta o "corpus". Un valore tf-idf aumenta proporzionalmente al numero di volte che una parola o una frase appare in un documento.
Ciò viene poi compensato dal numero di volte in cui la parola o la frase appare in tutti i documenti del corpus. Questo è importante in quanto tiene conto del fatto che alcune parole appaiono più spesso nell'uso generale.
Prendi l'esempio di un termine di ricerca come "il miglior SEO". "The" è una parola che apparirebbe molte volte in tutti i documenti di un corpus. Di conseguenza, è meno importante per un valore td-idf se 'the' appare nel documento ricercato piuttosto che se lo fanno le altre parole meno comuni.
Tf-idf è il prodotto di due statistiche. Significa che moltiplichi l'uno per l'altro. È così che rappresenta l'importanza di una parola o frase e compensa la frequenza generale di quella parola o frase. Le due statistiche sono Term Frequency (tf) e Inverse Document Frequency (idf).
Frequenza dei termini
La frequenza dei termini è la metà più semplice di tf-idf. Rappresenta la frequenza con cui un termine appare in un dato documento. Tutto ciò che serve per calcolare la frequenza dei termini è la lunghezza della parola del documento e il numero di volte in cui il termine appare. Quindi dividi il numero di volte in cui la parola appare per il conteggio totale delle parole. Ciò significa che la frequenza del termine sarà sempre un valore compreso tra zero e uno.
Al livello più semplice possibile, la frequenza dei termini viene elaborata nel modo seguente:
TF (Frequenza termine) = t (Numero di volte in cui il termine appare in un documento) / d (parole totali nel documento)
Considerando la lunghezza del documento e il numero di volte in cui compare il termine, si ottiene una buona idea di quanto sia pertinente il documento rispetto al termine dato. Non puoi saperlo con certezza, però, a meno che tu non sappia quanto spesso il termine appare nei documenti in generale. È qui che entra in gioco la frequenza inversa del documento (idf).
Frequenza inversa del documento
Le parole usate molto spesso in molti documenti non sono utili per determinare quali documenti sono rilevanti per uno specifico termine di ricerca. Inverse Document Frequency è una statistica che riduce il peso attribuito a quei termini comuni.
Garantisce che se stai cercando "la volpe bruna veloce", "il" che appare molte volte in un documento, non avrà la stessa importanza se sono presenti le altre parole. La frequenza inversa del documento è una misura della quantità di informazioni fornite da una parola o da un termine.
La formula per calcolare l'idf sembra piuttosto complicata:
IDF = log (Nd / fi)
Se lo scomponi nelle sue parti, non è così complesso.
Log è semplicemente una funzione matematica che non è troppo importante da capire. Puoi semplicemente premere il pulsante "log" su una calcolatrice se necessario. 'Nd' è il numero di documenti della collezione o del corpus oggetto della ricerca. 'fi' è il numero di quei documenti che contengono il termine di ricerca.
Ottieni il tuo valore IDF, quindi, dividendo il numero di documenti per il numero di documenti con il termine di ricerca e quindi applicando la funzione di registro.
Esempio risolto TF-IDF
Ora possiamo prendere quello che abbiamo imparato e usarlo per un esempio molto semplice. Supponiamo che tu abbia un documento di 100 parole e cerchi la parola "parola chiave". Se quella parola appare tre volte, puoi calcolare la frequenza del termine come segue:
3(numero di termini nel documento) / 100 (parole totali) = 0,03
La frequenza del termine è 0,03. Supponiamo ora che ci siano un totale di dieci milioni di documenti nel corpus che stai cercando e che la "parola chiave" appaia in 1.000 di essi. Ora hai tutto ciò di cui hai bisogno per elaborare il tuo idf:
Log(10.000.000 / 1.000) = 4
La frequenza inversa del tuo documento è 4. Un valore tf-idf è semplicemente la frequenza del termine moltiplicata per idf, quindi:
0,03 (tf) x 4 (idf) = 0,12
Il tuo valore tf-idf è 0,12. Questo da solo non ti dice molto, ma può essere paragonato ad altri valori. Più alto è il valore tf-idf, più significativo è un termine per il documento dato. I valori tf-idf più alti si ottengono quando c'è un'alta frequenza di termini e un basso numero di documenti che presentano il termine in un corpus. La seguente tabella dovrebbe aiutare a dimostrarlo:
Frequenza dei termini (TF) | Dimensione del corpo (Nd) | Documenti con Termine (fi) | Frequenza inversa del documento (IDF) | TF-IDF |
0.03 | 10.000.000 | 1.000 | 4 | 0.12 |
0.04 | 10.000.000 | 900 | 4.05 | 0,162 |
0,05 | 10.000.000 | 800 | 4.10 | 0,205 |
0.06 | 10.000.000 | 700 | 4.15 | 0,249 |
0.07 | 10.000.000 | 600 | 4.22 | 0,295 |
TF-IDF, SEO e LSI
Tf-idf è più spesso utilizzato come parte di Latent Semantic Indexing (LSI). Questo è certamente ciò che collega direttamente tf-idf e SEO. LSI con tf-idf è una tecnica per l'elaborazione del linguaggio. Consente di classificare i documenti in base alla rilevanza per un singolo termine di ricerca o per un'area tematica più ampia.
LSI lavora identificando modelli nelle relazioni tra diverse frasi e concetti in raccolte di testo non strutturate. Si basa sull'idea che le parole usate negli stessi contesti tendono ad avere significati correlati o simili.
Stabilendo i modelli tra termini e frasi, LSI rende possibile discernere l'argomento generale o il soggetto di un corpo di testo. Quando LSI con tf-idf viene applicato a un corpus di documenti, una query o un termine di ricerca restituirà risultati più accurati.

Questo perché i risultati includeranno documenti concettualmente simili nel significato alla ricerca. Sarà così anche se i documenti non contengono parole specifiche del termine di ricerca. L'obiettivo di LSI con tf-idf è quello di dare un senso ai soggetti reali e ai punti focali di un corpus di documenti.
In breve, tf-idf quando viene utilizzato come parte di LSI consente alle macchine di capire di cosa trattano le pagine di testo. È quindi il modo in cui Google e altri motori di ricerca possono valutare la pertinenza e l'utilità dei contenuti.
L'importanza di tf-idf per la SEO sta sicuramente diventando più chiara. È uno dei primi fattori di ranking nei motori di ricerca e può anche essere visto come un elemento chiave dei motori di ricerca e delle SERP. Ancora più importante, tf-idf aiuta Google a valutare l'effettiva rilevanza e utilità delle pagine in relazione a qualsiasi termine di ricerca o query.
Ciò solleva la questione di come la nostra migliore comprensione di tf-idf possa essere utilizzata per la SEO. Che si tratti di un'agenzia SEO SaaS o di un piccolo imprenditore che cerca di aumentare il traffico organico. AJ Ghergich ha detto la sua in un video SEMrush sull'argomento:
'L'obiettivo generale di tf-idf è misurare statisticamente l'importanza di una parola in una raccolta di documenti. È come uno strumento di densità delle parole chiave davvero utile con gli steroidi.'
SEMrush
Questa è una bella analogia, ma potrebbe essere un po' fuorviante. L'analisi Tf-idf non è utilizzata al meglio per identificare le parole chiave da inserire nei contenuti. È meglio pensarlo come una sorta di strumento di ispirazione dei contenuti.
L'utilizzo di tf-idf per confrontare i tuoi contenuti con pagine simili che si posizionano meglio, può darti suggerimenti su come arricchire i contenuti. Indicherà parole chiave e frasi per le quali il contenuto con un punteggio più alto ottiene valori tf-idf migliori rispetto alle tue pagine.
Ciò mostrerà quali aree tematiche e argomenti i tuoi contenuti non coprono in modo così dettagliato o pagine simili. Hai quindi una tabella di marcia su come migliorare i tuoi contenuti in un modo che piacerà sicuramente a Google. Cioè migliorando la sua pertinenza e quanto soddisfa l'intento degli aspiranti lettori che cercano parole chiave o frasi particolari.
Utilizzo di TF-IDF per la SEO
L'utilizzo di TF-IDF per la SEO non riguarda la densità delle parole chiave. Va ben oltre.
L'esecuzione di un'analisi tf-idf rivela termini e frasi che i tuoi contenuti non trattano così come altre pagine. Il tuo prossimo passo quindi non è iniziare a inserire quelle frasi all'interno del tuo contenuto esistente per aumentare la densità delle parole chiave. Quello che vuoi fare è ottimizzare i tuoi contenuti in modo che siano più pertinenti agli argomenti e agli argomenti che circondano quelle frasi.
Potresti, ad esempio, avere una pagina con la SEO come argomento principale. Un'analisi tf-idf può rivelare che ha meno valore per il termine "link building" rispetto ad altre pagine che si posizionano molto bene per le ricerche SEO. Ciò ti dice che i tuoi contenuti non forniscono informazioni utili e pertinenti sufficienti sulla creazione di collegamenti. Semplicemente, hai un modo preciso per migliorare i tuoi contenuti.
Prima di poter pensare a migliorare i tuoi contenuti, devi sapere come eseguire un'analisi tf-idf. Affrontiamolo adesso.
Come completare un'analisi TF-IDF
È tecnicamente possibile eseguire manualmente un'analisi tf-idf, eseguendo i propri calcoli. Sebbene possibile, non è consigliato. Come hai già visto, i calcoli possono diventare un po' complicati e richiederanno sempre tempo.
Non è nemmeno il problema più grande. Un'analisi tf-idf è utile solo se il corpus con cui si confrontano i contenuti è pertinente e utile. Vuoi essere in grado di confrontare i valori tf-idf dei tuoi contenuti con altre pagine che hanno un buon punteggio per le tue parole chiave importanti. È qui che entra in gioco uno strumento tf-idf, come quello offerto da Ryte.
Lo strumento di Ryte può confrontare un URL live del tuo sito con i primi dieci risultati di ricerca di Google per una determinata parola chiave o query di ricerca. Fornirà quindi un elenco di termini e frasi correlati importanti per i quali il contenuto altamente classificato ha un valore tf-idf elevato.
Inoltre, lo strumento di Ryte valuterà anche l'URL scelto rispetto a quelle frasi e termini. Mostrerà se i tuoi contenuti hanno valori tf-idf alti, alti o bassi per ciascuno di essi.
Queste informazioni ti mostreranno dove e come i tuoi contenuti devono migliorare. Ti darà gli argomenti e gli argomenti che la tua pagina non copre in modo abbastanza efficiente. Sarai quindi in grado di personalizzare la pagina per soddisfare al meglio le esigenze e gli intenti dei suoi lettori.
Probabilmente ora ti starai chiedendo quando dovresti usare l'analisi tf-idf. Ci sono molte altre cose che devono essere fatte, dopotutto, nel campo della SEO e al di fuori.
Quando utilizzare l'analisi TF-IDF
Non c'è mai un brutto momento per pensare a migliorare i contenuti del tuo sito. Ci sono anche solo così tante ore al giorno. Ciò significa che è meglio implementare l'analisi tf-idf nelle circostanze in cui è più probabile che faccia la differenza. Ci sono una manciata di esempi di tali circostanze;
- Sbloccare il potenziale dei contenuti esistenti
Tf-idf può essere davvero utile se hai una pagina che si posiziona costantemente nella seconda pagina delle ricerche di Google. Avendo raggiunto così in alto nelle classifiche, la pagina ha chiaramente del potenziale. Un'analisi tf-idf può aiutarti a elaborare le modifiche esatte e le aggiunte necessarie per fare l'ultimo salto alla prima pagina.
- Guidare un nuovo piano di contenuti
Un'analisi tf-idf è eccellente come ispirazione per i contenuti. L'esecuzione di un'analisi sulle pagine che si posizionano bene per determinati argomenti e argomenti ti mostrerà cosa deve coprire il tuo contenuto. Questa può essere un'ottima base per delineare un piano per tutta una serie di nuovi contenuti.
- Arrestare le classifiche in calo
Se hai una pagina che era una delle migliori ma che sta scivolando verso il basso nelle classifiche per parole chiave importanti, tf-idf può aiutarti anche lì. Può mostrarti per quali parole chiave e argomenti le pagine che superano le tue stanno ottenendo valori tf-idf migliori. È quindi possibile migliorare e aggiornare i propri contenuti di conseguenza.
TF-IDF per SEO: andare oltre la densità delle parole chiave
C'è così tanto da considerare nel mondo moderno della SEO. L'architettura del sito, i collegamenti, la densità delle parole chiave e tutti gli altri elementi tradizionali rimangono cruciali. Si può sostenere, tuttavia, che il contenuto è ora re. O per lo meno che deve ricevere la stessa attenzione di uno qualsiasi di questi altri fattori.
I siti non possono più farla franca con il keyword stuffing o con il riempimento delle pagine con contenuti di spam duplicati o nascosti. I siti devono contenere contenuti di alta qualità che siano veramente utili per i lettori. Tf-idf è un modo importante in cui Google e altri motori di ricerca valutano i contenuti a tale riguardo.
È fondamentale, quindi, capire come funziona tf-idf e come si relaziona alla SEO. Una corretta comprensione e implementazione di tf-idf per SEO può aiutarti ad arricchire i tuoi contenuti e vedere i frutti nel tuo traffico organico.
Prenota una consulenza

Nick Brown è il fondatore e CEO di Accelerate Agency, un'agenzia SEO SaaS. Nick ha lanciato diverse attività online di successo, scrive per Forbes, ha pubblicato un libro ed è cresciuto rapidamente da un'agenzia del Regno Unito a un'azienda che ora opera negli Stati Uniti, APAC ed EMEA e impiega 160 persone. Una volta è stato anche attaccato da un gorilla di montagna