Zaktualizowano klastrowanie jednostek w Google SERP

Opublikowany: 2022-01-13

Aktualizacja patentu na jednostki klastrowe

grupowanie podmiotów

Jeden z moich ostatnich postów na blogu dotyczył grupowania przez Google wyników wiadomości według tematu w organicznych wynikach wyszukiwania. Google również pogrupował informacje o podmiotach w wynikach wyszukiwania. Jeśli teraz szukasz osób, które współpracowały z Humpreyem Bogartem w Casablance. W tych wynikach wyszukiwania możesz zobaczyć innych aktorów występujących w tym filmie. Możesz również zobaczyć powiązane pytania, które obejmują tych aktorów i film (oraz ontologię dotyczącą powiązanych kategorii filmu). Ten nowy post dotyczy grupowania jednostek i zmiany sposobu, w jaki Google dostarcza wyniki wyszukiwania związane z grupowaniem jednostek.

Oto przykład wyników wyszukiwania, które pokazują powiązania między aktorami a filmem Casablanca:

Klastrowanie podmiotów — Casablanca

Google ma patent kontynuacyjny z 3 stycznia 2022 r. O wcześniejszej wersji tego patentu pisałem w 2019 r. w poście Entity Clustering in Google Search Results

Roszczenia z pierwszego patentu

Ponieważ ten nowy patent jest patentem kontynuacyjnym, większość patentu jest identyczna. Patent zawiera zaktualizowane zastrzeżenia. Pierwsze roszczenie z wersji 2019 patentu Clustering Search Results brzmi następująco:

1. Sposób obejmujący: określanie pozycji odpowiadających na zapytanie; generowanie klastrów pierwszego poziomu pozycji, przy czym każdy klaster reprezentuje jednostkę w bazie wiedzy i zawiera pozycje zmapowane do jednostki; obliczanie odpowiedniego wyniku klastra dla każdego klastra pierwszego poziomu, przy czym odpowiedni wynik klastra dla klastra pierwszego poziomu jest oparty na odpowiednim wyniku sylwetki, który mierzy spójność i oddzielenie klastra pierwszego poziomu oraz na współczynniku sylwetki reprezentującym procent wszystkie klastry pierwszego poziomu mające odpowiedni wynik sylwetki powyżej progu; scalanie klastrów pierwszego poziomu w oparciu o relacje ontologii jednostek i odpowiednie wyniki klastrów obliczonych dla połączonych klastrów, przy czym odpowiedni wynik klastra połączonego klastra reprezentuje lepszy wynik niż odpowiednie wyniki klastra dla klastrów pierwszego poziomu zawartych w połączonym klastrze ; zastosowanie klastrowania hierarchicznego do połączonych klastrów, tworząc końcowe klastry, które maksymalizują odpowiednie wyniki klastrów dla klastrowania hierarchicznego; oraz dostarczanie elementów odpowiadających na zapytanie do wyświetlenia zgodnie z końcowymi klastrami.

Roszczenia ze zaktualizowanego patentu

Szczegółowo, post, który napisałem w 2019 roku, opisuje proces stojący za patentem klastrowania jednostek. Teraz nowa wersja patentu z pierwszego dnia 2022 roku ma nowy język, który mówi nam, co robi patent. Pierwszy zestaw oświadczeń z 1999 r. mówił nam o „wyniku sylwetki”, którego nie ma w nowych oświadczeniach. Roszczenia z 2022 r. zawierają pewne terminy, których nie ma w wersji z 2019 r.:

1. Sposób wykonywany przez wyszukiwarkę, obejmujący: określenie zestawu elementów odpowiadających na zapytanie; dla każdego elementu z zestawu elementów określonych jako odpowiadające na zapytanie: identyfikacja jednej lub więcej jednostek powiązanych z elementem i uzyskanie osadzenia dla elementu; generowanie klastrów pierwszego poziomu ze zbioru pozycji, przy czym każdy klaster reprezentuje jednostkę jednej lub więcej jednostek; tworzenie końcowych klastrów przez połączenie klastrów pierwszego poziomu w oparciu o relacje ontologiczne encji i osadzenia podobieństwa określone przy użyciu osadzeń pozycji, przy czym relacje ontologiczne encji obejmują hipernim, synonim i współhipernim; oraz dostarczanie elementów ze zbioru elementów odpowiadających na zapytanie do wyświetlenia zgodnie z końcowymi klastrami.

2. Sposób według zastrzeżenia 1, w którym klastry pierwszego poziomu, które są mniejsze, są najpierw łączone.

3. Sposób według zastrzeżenia 2, w którym scalanie mniejszych klastrów pierwszego poziomu obejmuje, w przypadku pierwszego klastra pierwszego poziomu: określenie drugiego klastra pierwszego poziomu i trzeciego klastra pierwszego poziomu związanego z pierwszym klastrem pierwszego poziomu na podstawie relacji ontologicznych podmiotu ; ustalenie, że trzeci klaster pierwszego poziomu i pierwszy klaster pierwszego poziomu są mniejsze niż drugi klaster pierwszego poziomu; oraz scalanie pierwszego klastra pierwszego poziomu z trzecim klastrem pierwszego poziomu.

4. Sposób według zastrzeżenia 1, w którym klastry pierwszego poziomu, które są najbardziej podobne, są najpierw łączone.

5. Sposób według zastrzeżenia 4, w którym najpierw scalanie pierwszych klastrów, które są najbardziej podobne, obejmuje, dla pierwszego klastra pierwszego poziomu: określenie drugiego klastra pierwszego poziomu i trzeciego klastra pierwszego poziomu związanego z pierwszym klastrem pierwszego poziomu w relacje ontologiczne podmiotu; ustalenie, że pierwszy klaster pierwszego poziomu jest bardziej podobny do drugiego klastra pierwszego poziomu niż trzeciego klastra pierwszego poziomu; oraz scalanie pierwszego klastra pierwszego poziomu z drugim klastrem pierwszego poziomu.

Nowsza wersja mówi nam, że zawiera „związki ontologiczne”, których nie zawiera pierwszy zestaw twierdzeń. Tak więc wiemy z SERP, że Bogart był w filmie „Casablanca”, podobnie jak wielu innych aktorów, którzy skupili się na tym wyniku wyszukiwania.

Grupowanie wyników wyszukiwania
Wynalazcy: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning i Ed Huai-Hsin Chi
Pełnomocnik: Google LLC
Patent USA: 11 216 503
Przyznano: 4 stycznia 2022
Złożono: 26 listopada 2019 r.

Abstrakcyjny

Implementacje zapewniają ulepszony system prezentowania wyników wyszukiwania w oparciu o powiązania encji z elementami wyszukiwania. Przykładowa metoda obejmuje generowanie klastrów pierwszego poziomu elementów odpowiadających na zapytanie, przy czym każdy klaster reprezentuje jednostkę w bazie wiedzy i obejmuje elementy zmapowane do jednostki, scalanie klastrów pierwszego poziomu na podstawie relacji ontologii jednostek, stosowanie hierarchicznego grupowania do połączone klastry, tworząc końcowe klastry i inicjując wyświetlanie elementów zgodnie z końcowymi klastrami. Inna przykładowa metoda obejmuje generowanie klastrów pierwszego poziomu z elementów odpowiadających na zapytanie, przy czym każdy klaster reprezentuje jednostkę w bazie wiedzy i zawiera elementy zmapowane do jednostki, tworząc klastry końcowe przez połączenie klastrów pierwszego poziomu na podstawie ontologii jednostki i przestrzeń osadzania, która jest generowana z modelu osadzania, który wykorzystuje odwzorowanie, oraz inicjowanie wyświetlania elementów odpowiadających na zapytanie zgodnie z końcowymi klastrami.

Jeśli cofniesz się do mojego oryginalnego opisu patentu dotyczącego grupowania jednostek z 2019 r., zobaczysz, że pisząc o jednostkach wiele razy wspominam o „ontologiach”. Wersja patentu na jednostki klastrowe z 2022 r. dodaje ten język bezpośrednio do zastrzeżeń. Są w SERPach bez omawiania relacji między filmem a jego aktorami.

Klastrowanie jednostek i aktualności

Po tej zmianie, gdy szukamy określonej encji i wiadomości, widzimy tam również zgrupowane wyniki wyszukiwania:

Wiadomości o jednostkach klastrujących

Tak więc Google nie sortuje już SERP na podstawie tego, jak dobre są dokumenty dopasowania dla terminów zapytań – Google grupuje tematy i relacje między podmiotami w ramach decyzji o tym, co uwzględnić w wynikach wyszukiwania.

Przeszukaj wiadomości prosto do skrzynki odbiorczej

To pole służy do celów walidacji i należy je pozostawić bez zmian.

*Wymagany