Optimizare avansată în pagină – Dincolo de densitatea cuvintelor cheie: TF-IDF pentru SEO
Publicat: 2021-02-26Știm cu toții că optimizarea pentru motoarele de căutare (SEO) nu este nouă. Acum este un domeniu bine stabilit și cu multe fațete, care a suferit multe schimbări. Modul în schimbare în care motoarele de căutare evaluează și clasifică paginile a dus la multe dintre aceste răsturnări în SEO (aruncă o privire la acest articol despre costul SEO).
Crearea de legături este un alt lucru care a câștigat o importanță semnificativă. Asta s-a întâmplat odată ce importanța backlink-urilor a devenit clară. SEO mai tehnic a ieșit în prim-plan atunci când arhitectura informațională a oricărui site dat a fost recunoscută ca un factor crucial.
Importanța conținutului a devenit atunci clară. Motoarele de căutare au făcut cunoscut faptul că site-urile ar trebui să aibă conținut relevant de înaltă calitate. La început, asta i-a determinat pe profesioniștii SEO să alerge pentru instrumentele lor de densitate a cuvintelor cheie și de planificare a cuvintelor cheie. Pe scurt, a devenit evident că nu era cea mai bună cale de a merge. Sau cel puțin, că utilizarea acelor instrumente pentru practici dubioase, cum ar fi umplerea cuvintelor cheie, nu avea să funcționeze. Nu ar păcăli algoritmii motoarelor de căutare.
Google și alte motoare de căutare caută conținut real de înaltă calitate. Ei recompensează conținutul care este cu adevărat relevant pentru presupusul său subiect și care răspunde intenției dorite a utilizatorului. Crearea unui astfel de conținut a fost principalul sfat de la Google pentru recuperarea de la renumita sau infama actualizare medicală.
Rezervați o consultație
Prin urmare, este evident că Google și alte motoare de căutare pot evalua și evalua cu acuratețe subiectul și sensul conținutului. Un mod în care fac acest lucru este prin folosirea tf-idf. Tf-idf este unul dintre cei mai vechi factori de clasare utilizați de motoarele de căutare. La cel mai simplu nivel, le permite să înțeleagă despre ce sunt paginile.
Acest ghid final pentru tf-idf pentru SEO vă va oferi toate informațiile de care ați putea avea nevoie. Acesta va acoperi ce este tf-idf și cum funcționează, cum se leagă tf-idf de SEO și cum și când puteți utiliza analiza tf-idf.
Ce este TF-IDF?
Tf-idf este o statistică numerică utilizată în regăsirea informațiilor. Reprezintă cât de important este un cuvânt sau o expresie pentru un document dat, în comparație cu alte documente dintr-o colecție sau „corpus”. O valoare tf-idf crește proporțional cu numărul de ori când un cuvânt sau o expresie apare într-un document.
Acest lucru este apoi compensat de numărul de ori când acel cuvânt sau expresie apare în toate documentele din corpus. Acest lucru este important, deoarece se ajustează pentru faptul că unele cuvinte apar mai des în uz general.
Luați exemplul unui termen de căutare precum „cel mai bun SEO”. „The” este un cuvânt care apare de multe ori în toate documentele dintr-un corpus. Ca urmare, este mai puțin important pentru o valoare td-idf dacă „the” apare în documentul căutat decât dacă apar celelalte cuvinte mai puțin uzuale.
Tf-idf este produsul a două statistici. Adică înmulțiți unul cu celălalt. Acesta este modul în care reprezintă importanța unui cuvânt sau a unei fraze și compensează frecvența generală a acelui cuvânt sau frază. Cele două statistici sunt Term Frequency (tf) și Inverse Document Frequency (idf).
Frecvența termenului
Frecvența termenului este jumătatea mai simplă a tf-idf. Reprezintă cât de des apare un termen într-un document dat. Tot ceea ce este necesar pentru a calcula frecvența termenului este lungimea cuvântului din document și de câte ori apare termenul. Apoi împărțiți de câte ori apare cuvântul la numărul total de cuvinte. Aceasta înseamnă că frecvența termenului va fi întotdeauna o valoare între zero și unu.
La cel mai simplu nivel posibil, frecvența termenului este calculată în felul următor:
TF (Frecvența termenului) = t (De câte ori apare termenul într-un document) / d (numărul total de cuvinte din document)
Luând în considerare lungimea documentului și de câte ori apare termenul, vă faceți o idee corectă despre cât de relevant este documentul pentru termenul dat. Totuși, nu poți ști cu siguranță decât dacă știi cât de des apare termenul în documente în general. Aici intervine Inverse Document Frequency (IDF).
Frecvența inversă a documentelor
Cuvintele care sunt folosite foarte des în multe documente nu sunt bune pentru a determina ce documente sunt relevante pentru un anumit termen de căutare. Frecvența inversă a documentului este o statistică care reduce ponderea acordată acelor termeni obișnuiți.
Vă asigură că, dacă căutați „vulpea maro rapidă”, „vulpea” care apare de multe ori într-un document, nu va conta la fel de mult ca dacă celelalte cuvinte ar fi prezente. Frecvența inversă a documentului este o măsură a câte informații oferă un cuvânt sau un termen.
Formula pentru elaborarea idf pare destul de complicată:
IDF = log (Nd / fi)
Dacă îl descompuneți în părți, nu este atât de complex.
Jurnalul este pur și simplu o funcție matematică pe care nu este prea important de înțeles. Puteți apăsa doar butonul „jurnal” de pe un calculator dacă aveți nevoie vreodată. „Nd” este numărul de documente din colecția sau corpus care sunt căutate. „fi” este numărul acelor documente care conțin termenul de căutare.
Obțineți valoarea IDF, apoi, împărțind numărul de documente la numărul de documente cu termenul de căutare și apoi aplicând funcția de jurnal.
Exemplu rezolvat TF-IDF
Acum putem lua ceea ce am învățat și îl putem folosi pentru un exemplu foarte simplu. Să presupunem că aveți un document de 100 de cuvinte și îl căutați după cuvântul „cuvânt cheie”. Dacă acel cuvânt apare de trei ori, puteți calcula frecvența termenului după cum urmează:
3(numărul de termeni din document) / 100 (numărul total de cuvinte) = 0,03
Frecvența dvs. de termen este 0,03. Acum spuneți că există un total de zece milioane de documente în corpus pe care îl căutați și că „cuvânt cheie” apare în 1.000 dintre ele. Acum aveți tot ce aveți nevoie pentru a vă calcula IDF:
Log(10.000.000 / 1.000) = 4
Frecvența inversă a documentului este 4. O valoare tf-idf este pur și simplu frecvența termenului înmulțită cu idf, deci:
0,03 (tf) x 4 (idf) = 0,12
Valoarea ta tf-idf este 0,12. Asta de la sine nu îți spune mare lucru, dar poate fi comparat cu alte valori. Cu cât valoarea tf-idf este mai mare, cu atât un termen este mai semnificativ pentru documentul dat. Cele mai mari valori tf-idf rezultă atunci când există o frecvență mare a termenului și un număr redus de documente care conțin termenul într-un corpus. Următorul tabel ar trebui să ajute să demonstreze acest lucru:
Frecvența termenului (TF) | Dimensiunea corpusului (Nd) | Documente cu termen (fi) | Frecvența inversă a documentelor (IDF) | TF-IDF |
0,03 | 10.000.000 | 1.000 | 4 | 0,12 |
0,04 | 10.000.000 | 900 | 4.05 | 0,162 |
0,05 | 10.000.000 | 800 | 4.10 | 0,205 |
0,06 | 10.000.000 | 700 | 4.15 | 0,249 |
0,07 | 10.000.000 | 600 | 4.22 | 0,295 |
TF-IDF, SEO și LSI
Tf-idf este folosit cel mai adesea ca parte a indexării semantice latente (LSI). Acesta este cu siguranță ceea ce conectează direct tf-idf și SEO. LSI cu tf-idf este o tehnică de procesare a limbajului. Permite clasarea documentelor pe baza relevanței pentru un termen de căutare individual sau pentru o zonă tematică mai largă.
LSI funcționează prin identificarea tiparelor în relațiile dintre diferite fraze și concepte din colecții nestructurate de text. Se bazează pe ideea că cuvintele folosite în aceleași contexte tind să aibă semnificații înrudite sau similare.
Prin stabilirea tiparelor dintre termeni și fraze, LSI face posibilă discernerea subiectului general sau subiectului unui corp de text. Când LSI cu tf-idf este aplicat unui corp de documente, o interogare sau un termen de căutare va returna rezultate mai precise.

Asta pentru că rezultatele vor include documente similare din punct de vedere conceptual cu sensul căutării. Acesta va fi cazul chiar dacă documentele nu conțin cuvinte specifice din termenul de căutare. Scopul LSI cu tf-idf este de a da sens subiectelor reale și concentrărilor unui corpus de documente.
Pe scurt, tf-idf, atunci când este utilizat ca parte a LSI, permite mașinilor să înțeleagă despre ce pagini de text este vorba. Prin urmare, acesta este modul în care Google și alte motoare de căutare pot evalua relevanța și utilitatea conținutului.
Importanța tf-idf pentru SEO devine cu siguranță din ce în ce mai clară. Este unul dintre cei mai timpurii factori de clasare a motoarelor de căutare și poate fi chiar văzut ca un element cheie al motoarelor de căutare și al SERP-urilor. Mai important, tf-idf ajută Google să evalueze relevanța reală și utilitatea paginilor în raport cu orice termen de căutare sau interogare.
Asta ridică întrebarea cum poate fi folosită înțelegerea noastră mai bună a tf-idf pentru SEO. Fie că este vorba de o agenție SEO SaaS sau de un proprietar de afaceri mici care dorește să stimuleze traficul organic. AJ Ghergich și-a spus cuvântul într-un videoclip SEMrush pe această temă:
„Scopul general al tf-idf este de a măsura statistic cât de important este un cuvânt într-o colecție de documente. Este ca un instrument foarte util pentru densitatea cuvintelor cheie pe steroizi.'
SEMrush
Este o mică analogie, dar ar putea fi puțin înșelătoare. Analiza Tf-idf nu este utilizată cel mai bine pentru a identifica cuvintele cheie de inserat în conținut. Este mai bine să ne gândim la el ca pe un fel de instrument de inspirație pentru conținut.
Utilizarea tf-idf pentru a vă compara propriul conținut cu pagini similare care se clasează mai bine vă poate oferi sugestii cu privire la modul de îmbogățire a conținutului. Acesta va indica cuvintele cheie și expresii pentru care conținutul clasat mai înalt obține valori tf-idf mai bune decât paginile dvs.
Aceasta va arăta ce domenii și subiecte nu acoperă conținutul dvs. la fel de detaliat sau pagini similare. Aveți apoi o foaie de parcurs despre cum să vă îmbunătățiți conținutul într-un mod care să-i placă cu siguranță Google. Asta prin sporirea relevanței și cât de bine satisface intenția potențialilor cititori care caută anumite cuvinte cheie sau expresii.
Utilizarea TF-IDF pentru SEO
Utilizarea TF-IDF pentru SEO nu se referă la densitatea cuvintelor cheie. Se mișcă cu mult dincolo de asta.
Efectuarea unei analize tf-idf dezvăluie termeni și expresii cu care conținutul dvs. nu se ocupă, precum și alte pagini. Următorul pas atunci este să nu începeți să inserați acele fraze în conținutul dvs. existent pentru a crește densitatea cuvintelor cheie. Ceea ce doriți să faceți este să vă optimizați conținutul, astfel încât să fie mai relevant pentru subiectele și subiectele care înconjoară acele fraze.
S-ar putea, de exemplu, să aveți o pagină cu SEO ca subiect principal. O analiză tf-idf poate dezvălui că are mai puțină valoare pentru termenul „link-building” decât alte pagini care se clasează foarte bine pentru căutările SEO. Aceasta vă spune că conținutul dvs. nu oferă suficiente informații relevante și utile despre crearea de link-uri. La fel de simplu, aveți o modalitate sigură de a vă îmbunătăți conținutul.
Înainte de a vă putea gândi la îmbunătățirea conținutului, trebuie să știți cum să efectuați o analiză tf-idf. Să ne ocupăm de asta chiar acum.
Cum să finalizați o analiză TF-IDF
Din punct de vedere tehnic, este posibil să rulați manual o analiză tf-idf, efectuând propriile calcule. Deși este posibil, nu este recomandat. După cum ați văzut deja, calculele se pot complica puțin și vor dura întotdeauna.
Asta nu este nici măcar cea mai mare problemă. O analiză tf-idf merită numai dacă corpusul cu care comparați conținutul este relevant și util. Doriți să puteți compara valorile tf-idf ale conținutului dvs. cu alte pagini care apreciază bine cuvintele cheie importante. Aici intervine un instrument tf-idf, precum cel oferit de Ryte.
Instrumentul Ryte poate compara o adresă URL live de pe site-ul dvs. cu primele zece rezultate de căutare Google pentru un anumit cuvânt cheie sau o anumită interogare de căutare. Acesta va oferi apoi o listă de termeni și expresii înrudiți importanți pentru care conținutul bine clasat are o valoare tf-idf ridicată.
În plus, instrumentul Ryte va evalua, de asemenea, adresa URL aleasă de dvs. în raport cu acele expresii și termeni. Acesta va arăta dacă conținutul dvs. are valori la fel de ridicate, mai mari sau mai mici pentru fiecare dintre ele.
Aceste informații vă vor arăta unde și cum trebuie să vă îmbunătățiți conținutul. Vă va oferi subiectele și subiectele pe care pagina dvs. nu le acoperă suficient de eficient. Prin urmare, veți putea adapta pagina pentru a se potrivi mai bine nevoilor și intențiilor cititorilor săi.
Probabil că acum vă întrebați când ar trebui să utilizați analiza tf-idf. Există o mulțime de alte lucruri care trebuie făcute, până la urmă, în domeniul SEO și în afara.
Când să utilizați analiza TF-IDF
Nu există niciodată un moment prost să te gândești la îmbunătățirea conținutului site-ului tău. Există, de asemenea, doar atâtea ore în zi. Asta înseamnă că cel mai bine este să implementezi analiza tf-idf în circumstanțele în care este cel mai probabil să facă diferența. Există o mână de exemple de astfel de circumstanțe;
- Deblocarea potențialului conținutului existent
Tf-idf poate fi cu adevărat util dacă aveți o pagină care se clasează constant pe a doua pagină a căutărilor Google. După ce a ajuns atât de sus în clasament, pagina are în mod clar potențial. O analiză tf-idf vă poate ajuta să stabiliți exact modificările și completările de care aveți nevoie pentru a face ultimul salt la prima pagină.
- Îndrumarea unui nou plan de conținut
O analiză tf-idf este superbă ca inspirație pentru conținut. Efectuarea unei analize a paginilor care se clasifică bine pentru anumite subiecte și subiecte îți va arăta ce trebuie să acopere propriul tău conținut. Aceasta poate fi o bază excelentă pentru a schița un plan pentru o mulțime de conținut nou.
- Oprirea clasamentelor în scădere
Dacă aveți o pagină care obișnuia să fie cea mai performantă, dar care scapă în clasament pentru cuvinte cheie importante, tf-idf vă poate ajuta și acolo. Vă poate arăta pentru ce cuvinte cheie și subiecte paginile care le depășesc pe ale dvs. obțin valori tf-idf mai bune. Apoi vă puteți îmbunătăți și actualiza propriul conținut în consecință.
TF-IDF pentru SEO – Deplasarea dincolo de densitatea cuvintelor cheie
Sunt atât de multe de luat în considerare în lumea modernă a SEO. Arhitectura site-ului, linkurile, densitățile de cuvinte cheie și toate celelalte elemente tradiționale rămân cruciale. Se poate argumenta, totuși, că conținutul este acum rege. Sau cel puțin că trebuie să i se acorde la fel de multă atenție ca oricăruia dintre acești factori.
Site-urile nu mai pot scăpa cu umplerea cuvintelor cheie sau cu umplerea paginilor cu conținut spam duplicat sau ascuns. Site-urile trebuie să conțină conținut de înaltă calitate, care este cu adevărat util pentru cititori. Tf-idf este o modalitate majoră prin care Google și alte motoare de căutare evaluează conținutul în acest sens.
Prin urmare, este crucial să înțelegeți cum funcționează tf-idf și cum se leagă de SEO. O înțelegere și implementare adecvată a tf-idf pentru SEO vă poate ajuta să vă îmbogățiți conținutul și să vedeți recompensele din traficul dvs. organic.
Rezervați o consultație

Nick Brown este fondatorul și CEO-ul accelerate agency, o agenție SEO SaaS. Nick a lansat mai multe afaceri online de succes, scrie pentru Forbes, a publicat o carte și a crescut rapid de la o agenție din Marea Britanie la o companie care operează acum în SUA, APAC și EMEA și are 160 de angajați. De asemenea, a fost atacat odată de o gorilă de munte