Modelarea subiectelor în SEO – Noul mod de a vă clasa mai sus

Publicat: 2022-04-24

Modelarea subiectelor în SEO este utilizarea modelelor statistice pentru descoperirea subiectelor dintr-o colecție de documente. Examinând co-apariția cuvintelor și expresiilor pe mii de pagini, algoritmii sunt capabili să atribuie o relevanță actuală unei pagini și să claseze pagina în raport cu o interogare de căutare.

Topic Modeling In SEO – A Beginner’s Guide

Cuprins
De la cuvinte cheie la subiecte
Modelarea subiectelor vs clasificarea subiectelor
Două tipuri de modelare a subiectelor
Alocarea dirichlet latentă (LDA)
Analiza semantică latentă
Clustere de subiecte - Cheia pentru o clasare superioară
Postări de pilon și grupuri de subiecte
De ce clusterele de subiecte ajută la SEO?
Instrumente de modelare a subiectului
MarketMuse
Instrumentul de cercetare
Instrumentul Compete
Instrumentul de optimizare
Instrumentul Întrebări
Informații despre articol
Concluzie
Resurse conexe

De la cuvinte cheie la subiecte

În primele zile ale motoarelor de căutare - sfârșitul anilor 1990 - algoritmii nu făceau altceva decât să potrivească cuvintele cheie din rezultate cu cuvintele cheie din interogare. Motoarele de căutare nu au înțeles contextul interogării sau intenția din spatele cuvântului cheie.

Dar motoarele de căutare au parcurs un drum lung de atunci. Algoritmii motoarelor de căutare înțeleg acum nu doar cuvintele cheie, ci și subiectul din spatele cuvintelor cheie. Acest accent pe subiecte mai degrabă decât pe cuvinte cheie se numește SEO semantic.

Primul progres important în înțelegerea subiectelor a venit cu Google Hummingbird Update în 2013. Atunci Google a început să analizeze fraze întregi și nu doar cuvinte cheie individuale.

Următorul mare pas înainte a venit în 2015 cu algoritmul RankBrain de la Google, care a folosit procesarea limbajului natural (NLP) pentru a înțelege contextul și intenția din spatele interogărilor de căutare.

Până atunci, densitatea cuvintelor cheie ca măsură a relevanței a dispărut rapid în oglinda retrovizoare. Era înlocuit cu relevanță de actualitate. Cât de bine vă poziționați acum pe Google depinde de cât de cuprinzător acoperă articolul dvs. de conținut.

De atunci, Google și alte motoare de căutare au devenit din ce în ce mai bune în înțelegerea subiectelor. Ei fac acest lucru printr-o tehnică numită modelare subiect.

Modelarea subiectelor vs clasificarea subiectelor

Modelarea subiectelor este o metodă statistică de descoperire a relațiilor care există între cuvinte și fraze.

Cu modelarea subiectelor, algoritmul descoperă categoriile de informații în sine, nesupravegheat. Face acest lucru prin scanarea unui set de documente și gruparea cuvintelor și expresiilor în funcție de frecvența cu care apar împreună cu alte cuvinte și expresii. Modelarea subiectelor este o tehnică de învățare „nesupravegheată”: algoritmul descoperă categoriile însuși, pe baza tiparelor pe care le găsește.

Modelarea subiectelor este diferită de clasificarea subiectelor, care este o tehnică de învățare automată în care oamenii trebuie să „antreneze” algoritmul dându-i anumite reguli.

Cu clasificarea subiectelor, mai întâi trebuie să definiți categoriile de informații pe care doriți să le utilizați. Apoi oferiți algoritmului câteva exemple de date brute care au fost etichetate cu acele categorii predefinite. Algoritmul utilizează apoi acele categorii predefinite pentru a analiza datele.

Diferența dintre cele două tehnici este următoarea: în clasificarea subiectelor, oamenii spun algoritmului care sunt categoriile, în timp ce, în modelarea subiectelor, algoritmul descoperă care sunt categoriile prin analiza statistică a modului în care cuvintele și frazele se grupează în anumite modele.

Aceste metode de analiză a textului sunt folosite nu numai de motoarele de căutare, ci chiar pe internet.

De exemplu, o companie care primește un volum mare de feedback online al clienților ar putea folosi modelarea subiectelor sau clasificarea subiectelor pentru a-și sorta feedbackul în categorii, cum ar fi notificările post-cumpărare, urmărirea experienței, feedback-ul privind fidelitatea mărcii, plângerile clienților și recenziile clienților.

Două tipuri de modelare a subiectelor

Până acum, am folosit termenul „modelare subiect” ca și cum ar fi un singur lucru. Dar este de fapt un termen umbrelă care acoperă o serie de tehnici diferite.

Să ne uităm acum la câteva dintre diferitele tipuri de modelare a subiectelor.

Alocarea dirichlet latentă (LDA)

Latent Dirichlet Allocation (LDA) se bazează pe două presupuneri: că subiectele similare folosesc cuvinte similare și că documentele vorbesc despre mai multe subiecte pentru care poate fi detectată o distribuție statistică.

LDA mapează documentele la o listă de subiecte, atribuind subiecte aranjamente de cuvinte, cum ar fi n-gramele. Un n-gramă este o secvență de cuvinte care sunt utilizate în procesarea limbajului natural.

Indicatorul „n” se referă la numărul de cuvinte din n-gramă. Unde N=1, n-grama conține un cuvânt, unde N=2, n-grama conține două cuvinte și așa mai departe.

De exemplu, propoziția „Vaca sare peste lună” ar conține următoarele n-grame de 2 cuvinte (cunoscute ca bi-grame):

  • vaca
  • sarituri de vaca
  • sare peste
  • peste
  • luna

Odată ce ai n-grame, poți face apoi calcule care prezic probabilitatea ca anumite cuvinte să apară în aceeași propoziție sau în același paragraf, sau la o anumită distanță unul de celălalt.

Latent Dirichlet Allocation funcționează pe presupunerea că documentele constau din anumite aranjamente de cuvinte și că acele aranjamente determină subiectul documentului.

Analiza semantică latentă

La fel ca LDA, analiza semantică latentă se bazează pe ipoteza distribuțională: sensul cuvintelor poate fi înțeles analizând contextele în care apar cuvintele. După cum a spus lingvistul englez JR Firth: „Tu vei cunoaște un cuvânt după compania pe care o ține” (Firth, JR 1957:11).

Spre deosebire de LDA, care atribuie subiecte unor anumite aranjamente de cuvinte, analiza semantică latentă calculează pur și simplu cât de des apar cuvintele într-un set de documente. Se presupune că documentele care aparțin unor subiecte similare vor conține aproximativ aceeași distribuție a frecvenței cuvintelor pentru anumite cuvinte.

Metoda pe care o folosește pentru calcularea frecvenței cuvintelor este Frecvența termenului-Frecvența inversă a documentului sau tf-idf.

Frecvența termenului (TF) se referă la numărul de ori când un cuvânt cheie apare într-un singur document.

Frecvența inversă a documentelor (IDF), măsoară de câte ori apare termenul într-o colecție de documente.

Frecvența termenului (TF) este apoi împărțită la Frecvența documentului invers (IDF) pentru a obține valoarea TF-IDF.

Atât LDA, cât și LSA sunt tehnici nesupravegheate.

Clustere de subiecte - Cheia pentru o clasare superioară

După cum puteți vedea, motoarele de căutare își îndreaptă atenția de la cuvinte cheie la subiecte. Ei folosesc diverse metode statistice pentru a identifica modele în modul în care anumite cuvinte sunt găsite cu alte cuvinte. Aceste modele permit motoarelor de căutare să identifice subiecte.

Și de aceea, grupurile de subiecte sunt acum o parte vitală a clasamentului ridicat în rezultatele căutării.

Google dorește să furnizeze rezultate de căutare care să fie autorizate. Aceasta înseamnă furnizarea de conținut care acoperă bine un subiect, atât în ​​profunzime, cât și în amploare.

Postări de pilon și grupuri de subiecte

Cel mai bun mod de a face acest lucru este să utilizați modelul de cluster de subiecte. Aceasta este o colecție de pagini cu o pagină centrală numită postare pilon. Postarea pilon acoperă subiectul în profunzime și are de obicei cel puțin 3000 de cuvinte.

În postarea pilon, acoperiți toate subsubiectele asociate subiectului dvs. Dar nu intri neapărat în acele subteme în detaliu. Petreceți câteva paragrafe introducând fiecare subtipic și apoi trimiteți la o postare separată de blog, unde acoperiți acel subtipic mai detaliat.

De exemplu, stâlpul tău ar putea fi despre „unelte de grădină”. Acesta ar fi un articol mai lung decât media în care descrieți pe scurt toate tipurile principale de unelte de grădină: mașini de tuns iarba, mașini de tuns, mașini de tuns gard viu, foarfece de tăiat, mulci, suflante de frunze, unelte de tăiat, stropitoare etc.

Apoi, veți crea o bucată de conținut separată pentru fiecare dintre acele subteme și veți crea un link către acele articole din postarea pilon.

De ce clusterele de subiecte ajută la SEO?

Cum vă ajută un grup de subiecte să vă poziționați mai sus? Le arată motoarelor de căutare că site-ul dvs. are autoritate de actualitate pentru un anumit subiect. Când creați un grup de subiecte, conținutul dvs. va fi plin de cuvinte cheie asociate. Și exact asta caută acum algoritmii motoarelor de căutare. Un site web care are zece sau cincisprezece pagini de conținut strâns legat și plin de cuvinte cheie care sunt de obicei găsite împreună va primi undă verde de la algoritm.

Până acum, în acest articol, am analizat de ce subiectele înlocuiesc cuvintele cheie ca obiectiv SEO și modul în care motoarele de căutare folosesc diverse instrumente de modelare a subiectelor pentru a înțelege subiectele și subsubiectele acestora.

În calitate de creator de conținut, s-ar putea să vă întrebați dacă există instrumente de modelare a subiectelor care vă vor ajuta să „elaborați” un anumit subiect, astfel încât să puteți crea conținut care acoperă în mod cuprinzător acel subiect.

Ei bine, nu este surprinzător, astfel de instrumente există deja. Și în secțiunea următoare, o să vă arăt două dintre ele.

Instrumente de modelare a subiectului

Această secțiune vă oferă o prezentare a două instrumente de modelare a subiectelor care vă vor ajuta să scrieți conținut cu o autoritate ridicată în materie de subiect.

MarketMuse

MarketMuse este un instrument de cercetare de conținut și de planificare a cuvintelor cheie bazat pe inteligență artificială. Folosește învățarea automată și inteligența artificială pentru a analiza conținutul, pentru a sugera subiecte de acoperit și pentru a dezvolta rezumate care să vă ajute să creați conținut mai bun.

Când vă conectați la MarketMuse, veți vedea cinci instrumente în meniul din stânga, Research, Compete, Optimize, Questions și Connect:

MarketMuse tools

Să ne uităm la aceste instrumente unul câte unul.

Instrumentul de cercetare

În instrumentul de cercetare, introduceți cuvântul cheie, iar MarketMuse va identifica subiectele principale pentru acel cuvânt cheie:

MarketMuse research tool

Subiectele apar în coloana din stânga. În coloana din dreapta, veți vedea volumul estimat de căutare pentru fiecare subiect asociat, precum și un grafic care arată tendința de căutare pentru acel subiect.

Coloana din extrema dreapta vă arată de câte ori ar trebui să menționați acel subiect asociat în conținutul dvs. MarketMuse folosește un cod de culoare pentru aceasta:

  • Galben = 1 până la 2 mențiuni
  • Verde = 3 până la 10 mențiuni
  • Albastru = 10+ mențiuni

Puteți detalia fiecare subiect asociat făcând clic pe subiect. Veți vedea o listă de variante pentru acel subiect:

MarketMuse research tool

Includerea acestor variante în conținutul dvs. vă va ajuta să vă clasificați pentru mai multe cuvinte cheie. De asemenea, va crește autoritatea de actualitate a articolului dvs., deoarece motoarele de căutare sunt acum conștiente de faptul că anumite cuvinte apar împreună în conținutul care acoperă un subiect în profunzime.

Instrumentul Compete

Instrumentul Compete creează un model de subiect analizând mii de documente. Apoi analizează primele 20 de rezultate în raport cu acel model și prezintă rezultatele ca o hartă termică.

Compete este folosit pentru a evalua și analiza competiția pentru un anumit subiect și pentru a lua decizii cu privire la acoperirea pe care doriți să o aveți pentru acel subiect.

Harta termică a Compete vă ajută să înțelegeți rapid modul în care concurența abordează un subiect despre care doriți să scrieți, ce subiecte conexe trebuie să includeți și pe care ar trebui să le abordați pentru a face conținutul să iasă în evidență din mulțime:

marketMuse compete tool

În partea de sus a ecranului Compete, veți vedea primele 20 de rezultate de căutare pentru acel subiect. Sub fiecare rezultat al căutării se află scorul de conținut MarketMuse pentru articolul respectiv. Acesta este un scor proprietar dezvoltat de MarketMuse care arată cât de bine acoperă pagina un subiect.

Codurile de culoare de pe harta termică vă arată cât de bine acoperă subiectul fiecare parte de conținut:

  • Roșu = 0 mențiuni
  • Galben = 1-2 mențiuni
  • Verde = 3-10 mențiuni
  • Albastru = 10+ mențiuni

O modalitate rapidă de a evalua cât de bine o pagină acoperă un subiect este scanarea verticală în jos pe o coloană:

use MarketMuse to check the topical authority of competing content

De asemenea, puteți vedea cum concurența acoperă un anumit subiect prin scanarea orizontală pe un rând:

MarketMuse compete tool

Un alt lucru de căutat în instrumentul Compete sunt scorurile de conținut. Acestea vă permit să vedeți dintr-o privire cât de bine acoperă acest subiect conținutul de top:

using content scores in MarketMuse

Dacă scorurile sunt scăzute, acesta este un indiciu că aveți o șansă bună să vă clasați înalt pentru acel subiect cu un conținut bine cercetat.

În partea stângă a ecranului Compete, veți vedea toate subiectele care compun modelul subiectului.

Când utilizați instrumentul Compete, trebuie să căutați două lucruri: subiecte obligatorii și lacune de subiecte.

Subiectele obligatorii sunt cele care se găsesc în mod constant printre paginile de top în rezultatele căutării. Pentru a funcționa bine, aceste subiecte trebuie incluse în lucrarea dvs.

Lacunele subiectelor sunt subiecte care nu sunt acoperite de competiție. Sunt o oportunitate excelentă de a-ți optimiza conținutul, incluzând subiecte pe care concurenții tăi le lipsesc.

Instrumentul de optimizare

Instrumentul Optimize este un editor de text care vă oferă feedback în timp real despre cât de bine acoperă conținutul un subiect. Introduceți cuvântul cheie și adresa URL a articolului dvs. și se va afișa MarketMuse

MarketMuse optimize tool

Codurile de culoare din panoul din dreapta vă arată de câte ori ați folosit acel termen și de câte ori ar trebui să utilizați acel termen.

Pe măsură ce adăugați termeni sugerați la conținutul dvs., codurile de culoare se vor actualiza pentru a arăta că vă apropiați de numărul optim de mențiuni pentru termenul respectiv.

Fila „Feed” vă oferă o evaluare curentă a cât de bine abordează conținutul dvs. subiectele, pe măsură ce derulați în jos în pagină:

using the MarketMuse optimize tool

În partea de sus a ecranului Compete, veți vedea o bară de stare care vă spune scorul de conținut, scorul mediu, scorul țintă, numărul de cuvinte, numărul mediu de cuvinte și numărul țintă de cuvinte:

MarketMuse word count and status bar

Instrumentul Întrebări

Instrumentul Întrebări din MarketMuse este util atunci când vă aflați în etapa de cercetare a scrierii articolului. Vă arată cele mai frecvente întrebări legate de subiectul dvs.:

MarketMuse questions tool

Includerea întrebărilor conexe în conținutul dvs. este o altă modalitate de a spori autoritatea subiectului articolului dvs.

În partea dreaptă a ecranului, veți vedea o coloană cu un buton care spune „Run in”. Acest lucru vă oferă opțiunea de a rula fiecare întrebare într-unul dintre celelalte patru instrumente:

MarketMuse questions tool

MarketMuse este un instrument puternic pentru analizarea unui subiect și pentru a vă asigura că conținutul piesei dvs. acoperă cât mai mult subiect posibil. Ceea ce face ca MarketMuse să fie deosebit de util este că se bazează pe rezultatele de top pentru acel cuvânt cheie.

Nu numai că vă arată ce subiecte sunt acoperite de paginile care se clasează în partea de sus a rezultatelor căutării. De asemenea, vă arată lacune ale subiectelor. Abordând lacunele subiectelor, puteți face conținutul dvs. să iasă în evidență față de celelalte pagini.

Informații despre articol

Articol Insights este un alt instrument de modelare a subiectelor.

Vă ajută să identificați cuvintele cheie care apar în primele 10 rezultate ale căutării pentru un anumit subiect. Ajută la analiza concurenților, comparând conținutul dvs. cu cel al concurenților, astfel încât să puteți vedea ce cuvinte cheie folosesc ei și nu sunteți. Și ajută la detectarea entităților prin etichetarea cuvintelor cheie ca persoană, produs, companie sau loc.

Primul lucru pe care trebuie să-l faceți în Articole Insights este să creați un proiect. Dați un nume proiectului și apoi adăugați cuvântul cheie pe care doriți să îl vizați:

Article Insights topic modeling tool

Cuvântul cheie intră apoi într-o coadă de procesare - poate dura câteva minute pentru a finaliza analiza.

Odată ce cuvântul cheie a fost procesat, trebuie să faceți clic pe butonul Vizualizare.

Veți vedea apoi un ecran care constă din două părți: interfața de scriere din stânga și analiza din dreapta:

Article Insights AI content tool

În editorul de articole, aveți două file: „Articol” și „Scurt”:

Article and Brief buttons

Scurtă este locul în care puteți lăsa note despre articol. Există un buton de distribuire de unde puteți obține un link pentru a partaja articolul cu scriitorii dvs.

În partea dreaptă este un panou cu toate analizele pentru conținutul dvs.:

Acestea includ:

  • număr de cuvinte
  • cuvintele cheie pe care le-ați folosit în articolul dvs
  • cuvinte cheie pe care le-au folosit concurenții tăi (analiza decalajului)
  • titlurile pe care le-ați folosit și numărul de titluri pe care le-au folosit concurenții dvs.
  • unicitatea conținutului dvs
  • scor de lizibilitate

Puteți începe să vă scrieți articolul de la zero sau puteți importa un articol în curs de la o adresă URL:

Article Insights import content

Odată ce ați încărcat conținut în editorul de articole, instrumentul vă analizează conținutul în raport cu primele 10 rezultate de căutare pentru acel cuvânt cheie:

Article Insights Score tab
  • Panourile 1 și 2 vă arată cât de complet este articolul dvs. și numărul de cuvinte pe care ar trebui să le urmăriți.
  • Panoul 3 vă arată primele 15 cuvinte cheie utilizate în conținutul dvs.
  • Panoul 4 vă arată cuvintele cheie pe care le-au folosit concurenții dvs. și câte dintre ele ați folosit.
  • Panoul 5 vă arată titlurile pe care le-ați folosit și le compară cu titlurile folosite de concurenții dvs.

Sub panoul Titluri se află un panou care arată un scor de „Unicitate” și un instrument care vă oferă un scor de citire Flesch:

Article Insights unique content tool

Instrumentul „unicitate” conține un buton numit „Rescrierea articolului”.

Faceți clic pe acesta și deschide editorul de articole, cu sugestii utile pentru sinonime pe care le puteți utiliza pentru a rescrie fragmentele pe care le-ați adăugat din fila „cercetare”. Treceți cursorul peste orice cuvânt evidențiat, iar instrumentul vă oferă sinonime alternative pentru acel cuvânt:

Article Insights re-writer tool

Acest lucru este foarte util, care vă ajută să vă rescrieți rapid conținutul.

În partea de sus a panoului din dreapta sunt șapte file. Până acum, am lucrat în fila Scor.

Dacă faceți clic pe fila Concurenți, veți vedea o listă a primilor 10 concurenți pentru acel cuvânt cheie, împreună cu o grupare de cuvinte cheie pentru fiecare concurent. Aceste grupări de cuvinte cheie vă arată cele mai bune cuvinte cheie utilizate de fiecare concurent:

Article Insights competitors tab

Puteți selecta și deselecta concurenții, ceea ce este util dacă există rezultate pe care le considerați că nu sunt relevante pentru conținutul dvs.

Următoarea filă este „Cercetare”. Această filă extrage fragmente din conținutul de top:

Article Insights research tab

Faceți clic pe un fragment de cercetare și acesta va fi adăugat în editorul de articole. Apoi trebuie să-l rescrieți pentru a face parte din propriul dvs. conținut.

Următoarea filă este „Titturi”. Această filă arată titlurile folosite pentru fiecare concurent pe care l-ați selectat. Puteți vedea exact câte titluri au pe pagina lor și ce nivel este.

Article Insights headings tab

Urmează fila „Întrebări”.

Această filă atrage întrebări de la Google care sunt legate de cuvântul cheie principal. Acestea sunt subiecte secundare pe care le puteți adăuga la articolul dvs. pentru a obține autoritate de actualitate:

Article Insights questions tab

Următoarea filă este „Subiecte”. Acest instrument vă arată cuvinte cheie înrudite, grupate pe subiecte. Paragrafele care se potrivesc cu acele subiecte sunt plasate în acel panou de subiecte pentru dvs.:

Article Insights topics tab

Subiectul vă ajută să descoperiți cuvinte cheie înrudite pe care le puteți adăuga cu ușurință la paragrafele dvs. Adăugarea acestor cuvinte înrudite la paragraful dvs. va crește autoritatea de actualitate a conținutului dvs. și va îmbunătăți drastic calitatea articolului dvs.

Ultima filă este „Duplicate”. Acest instrument detectează fragmente din conținutul dvs. care sunt duplicate. Trebuie să rescrieți orice marcat cu roșu de acest instrument.

Să revenim acum la panoul de cuvinte cheie din fila „Scor”, deoarece are o funcție utilă. Faceți clic pe un cuvânt cheie din panoul respectiv:

Article Insights

Acest cuvânt cheie va fi apoi evidențiat în fila Concurent. Apoi puteți vedea de câte ori concurenții dvs. au folosit acel cuvânt cheie:

Article Insights

Același cuvânt cheie va fi evidențiat și în fila „Cercetare”:

Article Insights research tab

Aceasta este o caracteristică utilă atunci când încercați să vă optimizați conținutul pentru un anumit cuvânt cheie.

Concluzie

Pe măsură ce algoritmii se îndepărtează de concentrarea asupra cuvintelor cheie și încearcă să înțeleagă subiecte, devine din ce în ce mai important ca conținutul dvs. să acopere un subiect în mod cuprinzător.

Aceasta devine cheia pentru clasarea în partea de sus a rezultatelor căutării.

În acest articol, am analizat diverse tehnici de modelare a subiectelor pe care motoarele de căutare le folosesc acum pentru a înțelege mai bine apariția cuvintelor într-un document și într-un set de documente.

Am văzut cum prezența, frecvența și proximitatea cuvintelor cheie similare dintr-un document sunt folosite de motoarele de căutare pentru a înțelege subiectele.

Este de înțeles că, dacă motoarele de căutare folosesc aceste instrumente pentru a înțelege autoritatea actuală, creatorii de conținut trebuie să folosească aceleași tehnici pentru a se asigura că conținutul lor acoperă un subiect în mod corespunzător.

Și aici intervin instrumente precum MarketMuse și Articole Insights. Ei folosesc AI pentru a analiza subiectul despre care scrieți și pentru a vă arăta care sunt subsubiectele din acel subiect și ce cuvinte cheie ar trebui să utilizați pentru a vă clasa bine pentru acel subiect.

Resurse conexe

  • Clustere de subiecte și SEO – 5 sfaturi simple pentru construirea de centre de conținut
  • SEO semantic - Un ghid pentru începători
  • Creați o structură siloz pe site-ul dvs. în 5 pași simpli
  • Ce este indexarea semantică latentă: 7 fapte importante
  • Ce sunt cuvintele cheie LSI și cum să le folosiți pentru a le clasa mai sus