Entidades de agrupamiento en SERP de Google actualizadas
Publicado: 2022-01-13Se actualiza la patente de entidades de agrupamiento
Una de mis últimas publicaciones en el blog fue sobre la agrupación de resultados de noticias de Google por tema en los resultados de búsqueda orgánicos. Google también ha agrupado información sobre entidades en los resultados de búsqueda. Si ahora busca personas que actuaron con Humprey Bogart en Casablanca. Puedes ver a otros actores en esa película en esos resultados de búsqueda. También puede ver preguntas relacionadas que incluyen a esos actores y la película (y esa ontología sobre las categorías asociadas a la película). Esta nueva publicación trata sobre la agrupación de entidades y un cambio en la forma en que Google entrega resultados de búsqueda relacionados con la agrupación de entidades.
Aquí hay un ejemplo de resultados de búsqueda que muestran conexiones entre los actores y la película Casablanca:
Google tiene una patente de continuación desde el 3 de enero de 2022. Había escrito sobre una versión anterior de esa patente en 2019 en la publicación Agrupación de entidades en los resultados de búsqueda de Google
Reclamaciones de la primera patente
Dado que esta nueva patente es una patente de continuación, la mayor parte de la patente es idéntica. La patente contiene reivindicaciones actualizadas. El primer reclamo de la versión 2019 de la patente Resultados de búsqueda de agrupamiento dice lo siguiente:
1. Un método que comprende: determinar elementos que respondan a una consulta; generar grupos de primer nivel de los elementos, representando cada grupo una entidad en una base de conocimiento e incluyendo elementos asignados a la entidad; calcular una puntuación de conglomerado respectiva para cada conglomerado de primer nivel, donde la puntuación de conglomerado respectiva para un conglomerado de primer nivel se basa en una puntuación de silueta respectiva que mide la coherencia y la separación del conglomerado de primer nivel y en una relación de silueta que representa un porcentaje de todos los grupos de primer nivel que tienen una puntuación de silueta respectiva por encima de un umbral; fusionar los clústeres de primer nivel en función de las relaciones de ontología de entidad y las puntuaciones de clúster respectivas calculadas para los clústeres fusionados, donde la puntuación de clúster respectiva de un clúster fusionado representa una puntuación mejor que las puntuaciones de clúster respectivas para los clústeres de primer nivel incluidos en el clúster fusionado ; aplicar agrupaciones jerárquicas a las agrupaciones fusionadas, produciendo agrupaciones finales que maximizan las puntuaciones de las respectivas agrupaciones para la agrupación jerárquica; y proporcionar los elementos que respondan a la consulta para su visualización de acuerdo con los grupos finales.
Reclamaciones de la patente actualizada
En detalle, la publicación que escribí en 2019 describe el proceso detrás de la patente de entidades de agrupación. Ahora, la nueva versión de la patente del primer día de 2022 tiene un nuevo lenguaje que nos dice qué hace la patente. El primer conjunto de reclamos en 1999 nos habló de una "puntuación de silueta", que no está en los nuevos reclamos. Los reclamos de 2022 incluyen algunos términos que no están en la versión de 2019:
1. Un método realizado por un motor de búsqueda que comprende: determinar un conjunto de elementos que respondan a una consulta; para cada elemento del conjunto de elementos determinados para responder a la consulta: identificar una o más entidades asociadas con el elemento y obtener una incrustación para el elemento; generar grupos de primer nivel a partir del conjunto de elementos, representando cada grupo una entidad de una o más entidades; producir agrupaciones finales fusionando las agrupaciones de primer nivel basadas en relaciones ontológicas de entidad e incrustando similitudes determinadas usando las incrustaciones de elementos, donde las relaciones ontológicas de entidad incluyen hiperónimo, sinónimo y co-hiperónimo; y proporcionar elementos del conjunto de elementos que respondan a la consulta para su visualización de acuerdo con los grupos finales.
2. El método de la reivindicación 1, en el que los grupos de primer nivel que son más pequeños se fusionan primero.
3. El método de la reivindicación 2, en el que fusionar los clústeres de primer nivel que son más pequeños incluye, para un primer clúster de primer nivel: determinar un segundo clúster de primer nivel y un tercer clúster de primer nivel relacionado con el primer clúster de primer nivel basado en las relaciones ontológicas de la entidad ; determinar que el tercer grupo de primer nivel y el primer grupo de primer nivel son más pequeños que el segundo grupo de primer nivel; y fusionar el primer grupo de primer nivel con el tercer grupo de primer nivel.
4. El método de la reivindicación 1, en el que los grupos de primer nivel que son más similares se fusionan primero.
5. El método de la reivindicación 4, en el que fusionar los primeros grupos que son más similares primero incluye, para un primer grupo de primer nivel: determinar un segundo grupo de primer nivel y un tercer grupo de primer nivel relacionado con el primer grupo de primer nivel en las relaciones ontológicas de la entidad; determinar que el primer grupo de primer nivel es más similar al segundo grupo de primer nivel que al tercer grupo de primer nivel; y fusionar el primer grupo de primer nivel con el segundo grupo de primer nivel.
La versión más reciente nos dice que incluye "relaciones ontológicas", lo que no incluye el primer conjunto de afirmaciones. Entonces, sabemos por los SERP que Bogart estaba en la película "Casablanca", al igual que muchos otros actores que estaban enfocados en ese resultado de búsqueda.

Agrupación de resultados de búsqueda
Inventores: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning y Ed Huai-Hsin Chi
Cesionario: Google LLC
Patente de EE. UU.: 11,216,503
Concedido: 4 de enero de 2022
Archivado: 26 de noviembre de 2019
Resumen
Las implementaciones proporcionan un sistema mejorado para presentar resultados de búsqueda basados en asociaciones de entidades de los elementos de búsqueda. Un método de ejemplo incluye la generación de grupos de primer nivel de elementos que responden a una consulta, cada grupo que representa una entidad en una base de conocimiento e incluye elementos asignados a la entidad, la fusión de los grupos de primer nivel en función de las relaciones de ontología de entidad, la aplicación de agrupación jerárquica a la agrupaciones fusionadas, produciendo agrupaciones finales e iniciando la visualización de los elementos de acuerdo con las agrupaciones finales. Otro método de ejemplo incluye generar clústeres de primer nivel a partir de elementos que responden a una consulta, cada clúster representa una entidad en una base de conocimiento e incluye elementos asignados a la entidad, produciendo clústeres finales al fusionar los clústeres de primer nivel basados en una ontología de entidad y un incrustar el espacio que se genera a partir de un modelo de incrustación que utiliza el mapeo e iniciar la visualización de los elementos que responden a la consulta de acuerdo con los grupos finales.
Si regresa a mi redacción original de esta patente de entidades de agrupamiento de 2019, verá que menciono "ontologías" muchas veces cuando escribo sobre entidades. La versión 2022 de la patente de entidades de agrupación agrega ese lenguaje directamente a las reivindicaciones. Están en las SERP sin discutir la relación entre la película y sus actores.
Agrupación de entidades y noticias
Después de este cambio, cuando buscamos una entidad específica y noticias, también vemos resultados de búsqueda agrupados allí:
Por lo tanto, Google ya no clasifica los SERP en función de qué tan buenos son los documentos de coincidencia para los términos de consulta: Google está agrupando temas y relaciones entre entidades como parte de su decisión sobre qué incluir en los resultados de búsqueda.
Busque noticias directamente en su bandeja de entrada
*Requerido