Clustering entități în SERP-urile Google Actualizat

Publicat: 2022-01-13

Patentul de entități de grupare este actualizat

gruparea entităților

Una dintre cele mai recente postări pe blog a fost despre Google cum ar fi gruparea rezultatelor știrilor după subiect în rezultatele căutării organice. Google a grupat informații despre entități și în rezultatele căutării. Dacă acum căutați oameni care au acționat cu Humprey Bogart în Casablanca. Puteți vedea alți actori din acel film în acele rezultate de căutare. Puteți vedea, de asemenea, întrebări conexe care includ acei actori și filmul (și acea ontologie despre categoriile asociate filmului). Această nouă postare este despre gruparea entităților și o schimbare a modului în care Google furnizează rezultate de căutare legate de gruparea entităților.

Iată un exemplu de rezultate ale căutării care arată legături dintre actori și filmul Casablanca:

Clustering de Entități - Casablanca

Google are un brevet de continuare din 3 ianuarie 2022. Am scris despre o versiune anterioară a acelui brevet în 2019 în postarea Entity Clustering in Google Search Results

Revendicari din primul brevet

Deoarece acest nou brevet este un brevet de continuare, cea mai mare parte a brevetului este identică. Brevetul conține revendicări actualizate. Prima revendicare din versiunea 2019 a brevetului Rezultatele căutării în cluster este următorul:

1. O metodă care cuprinde: determinarea elementelor care răspund la o interogare; generarea de grupuri de elemente de prim nivel, fiecare grup reprezentând o entitate într-o bază de cunoștințe și incluzând elemente mapate la entitate; calcularea unui scor de grup respectiv pentru fiecare grup de nivel întâi, în care scorul de grup respectiv pentru un grup de nivel întâi se bazează pe un scor de siluetă respectiv care măsoară coerența și separarea grupului de primul nivel și pe un raport de siluetă reprezentând un procent de toate clusterele de primul nivel având un scor de siluetă respectiv peste un prag; fuzionarea clusterelor de primul nivel pe baza relațiilor de ontologie de entitate și a scorurilor clusterelor respective calculate pentru clusterele comasate, în care scorul cluster respectiv al unui cluster îmbinat reprezintă un scor mai bun decât scorurile cluster respective pentru clusterele de primul nivel incluse în clusterul îmbinat ; aplicarea clusterizării ierarhice la clusterele comasate, producând clustere finale care maximizează scorurile clusterelor respective pentru clusteringul ierarhic; și furnizarea articolelor care răspund la interogare pentru afișare în funcție de clusterele finale.

Revendicări din brevetul actualizat

În detaliu, postarea pe care am scris-o în 2019 descrie procesul din spatele brevetului entităților de clustering. Acum, noua versiune a brevetului din prima zi a anului 2022 are un nou limbaj care ne spune ce face brevetul. Primul set de revendicări din 1999 ne-a spus despre un „scor de siluetă”, care nu este în noile revendicări. Afirmațiile din 2022 includ câțiva termeni care nu sunt în versiunea din 2019:

1. O metodă realizată de un motor de căutare cuprinzând: determinarea unui set de articole care răspund la o interogare; pentru fiecare articol din setul de articole determinate a răspunde la interogare: identificarea uneia sau mai multor entități asociate articolului și obținerea unei încorporare a articolului; generarea de clustere de prim nivel din setul de articole, fiecare cluster reprezentând o entitate a uneia sau mai multor entități; producerea de clustere finale prin fuzionarea clusterelor de prim nivel bazate pe relații ontologice de entitate și asemănări de încorporare determinate utilizând înglobările de elemente, în care relațiile ontologice de entitate includ hipernim, sinonim și co-hipernim; și furnizarea de articole din setul de articole care răspund la interogare pentru afișare în conformitate cu clusterele finale.

2. Metodă conform revendicării 1, caracterizată prin aceea că grupurile de prim nivel care sunt mai mici sunt îmbinate mai întâi.

3. Metodă conform revendicării 2, în care îmbinarea clusterelor de primul nivel care sunt mai mici include, pentru un prim cluster de primul nivel: determinarea unui al doilea cluster de prim nivel și a unui al treilea cluster de primul nivel legat de primul cluster de primul nivel bazate pe relaţiile ontologice ale entităţii ; determinarea faptului că al treilea cluster de primul nivel și primul cluster de primul nivel sunt mai mici decât al doilea cluster de primul nivel; și îmbinarea primului cluster de primul nivel cu al treilea cluster de primul nivel.

4. Metodă conform revendicării 1, în care grupurile de nivel întâi care sunt cele mai asemănătoare sunt îmbinate mai întâi.

5. Metodă conform revendicării 4, în care îmbinarea primelor clustere care sunt cele mai asemănătoare include mai întâi, pentru un prim cluster de prim nivel: determinarea unui al doilea cluster de prim nivel și a unui al treilea cluster de prim nivel legat de primul cluster de primul nivel din relațiile ontologice ale entității; determinarea faptului că primul cluster de primul nivel este mai asemănător cu al doilea cluster de primul nivel decât cu al treilea cluster de primul nivel; și îmbinarea primului cluster de primul nivel cu al doilea cluster de primul nivel.

Versiunea mai nouă ne spune că include „relații ontologice”, ceea ce primul set de afirmații nu le include. Deci, știm din SERP-urile că Bogart a fost în filmul „Casablanca”, la fel ca mulți alți actori care s-au concentrat pe acel rezultat al căutării.

Gruparea rezultatelor căutării
Inventatori: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning și Ed Huai-Hsin Chi
Cesionar: Google LLC
Brevet SUA: 11.216.503
Acordat: 4 ianuarie 2022
Depus: 26 noiembrie 2019

Abstract

Implementările oferă un sistem îmbunătățit de prezentare a rezultatelor căutării pe baza asocierilor de entități ale elementelor de căutare. Un exemplu de metodă include generarea de grupuri de elemente de prim nivel care răspund la o interogare, fiecare cluster reprezentând o entitate dintr-o bază de cunoștințe și incluzând elemente mapate la entitate, fuzionarea clusterelor de prim nivel pe baza relațiilor de ontologie de entitate, aplicarea grupării ierarhice la clustere îmbinate, producând clustere finale și inițiind afișarea articolelor în funcție de clusterele finale. Un alt exemplu de metodă include generarea de clustere de primul nivel din elemente care răspund la o interogare, fiecare cluster reprezentând o entitate dintr-o bază de cunoștințe și incluzând elemente mapate la entitate, producând clustere finale prin fuzionarea clusterelor de prim nivel bazate pe o ontologie de entitate și un spațiu de încorporare care este generat dintr-un model de încorporare care utilizează maparea și inițiază afișarea elementelor care răspund la interogare în funcție de clusterele finale.

Dacă vă întoarceți la articolul meu original al acestui brevet de grupare a entităților din 2019, veți vedea că menționez „ontologii” de multe ori când scriu despre entități. Versiunea 2022 a brevetului entităților de clustering adaugă acest limbaj direct la revendicări. Ei sunt în SERP-uri fără a discuta despre relația dintre film și actorii săi.

Clustering entități și știri

După această modificare, când căutăm o anumită entitate și știri, vedem și acolo rezultate grupate de căutare:

Noutăți despre entitate de grupare

Prin urmare, Google nu mai sortează SERP-urile în funcție de cât de bune sunt documentele de potrivire pentru termenii de interogare - Google grupează subiecte și relații între entități ca parte a deciziei sale cu privire la ce să includă în rezultatele căutării.

Căutați știri direct în căsuța dvs. de e-mail

Acest câmp este în scop de validare și trebuie lăsat neschimbat.

*Necesar