Recherche de citations d'entités modifiées sur Google

Publié: 2022-02-19

Le brevet derrière la recherche de citations d'entités a de nouveau été modifié par le brevet de continuation

Recherche de cotations d'entités

Lorsque Google met à jour certains processus, ils peuvent déposer un brevet mis à jour pour protéger la propriété intellectuelle derrière le processus. Cela peut signifier le dépôt d'un brevet où la majeure partie de la description du brevet est identique ou presque un double aux versions antérieures du brevet. Les titres changent parfois un peu, mais la liste des auteurs reste généralement la même (j'en ai vu un où un nouvel auteur a été ajouté.)

Le brevet de Google "Systèmes et méthodes de recherche de cotations d'entités à l'aide d'une base de données" a été mis à jour une deuxième fois. Pour essayer de comprendre ce qui a changé, il a fallu lire les revendications du brevet et voir comment la description du fonctionnement du brevet a changé.

Lorsque l'USPTO décide d'accorder ou non un brevet, ses agents de poursuite examinent les revendications pour voir si elles sont nouvelles, non évidentes et utiles. Étant donné qu'un brevet de continuation tente de mettre à jour la protection et d'utiliser la date du brevet original comme début de la période d'exclusion, l'agent de brevets s'assure que ces nouvelles revendications sont valides avant d'accorder un brevet de continuation.

J'ai d'abord écrit sur ce brevet dans un article précédent sur Go Fish Digital : Google Searching Quotes of Entities. Si vous voulez avoir une bonne idée de la façon dont le processus derrière ce brevet a fonctionné lors de sa sortie initiale, je vous recommande de lire cet article avant d'aller trop loin ici.

J'ai poursuivi avec un article sur SEObythesea : recherche de citations mise à jour sur Google pour se concentrer sur les vidéos. Il décrit les modifications apportées au procédé décrit dans les revendications au poste, après le premier brevet de continuation.

Ces affirmations ont été à nouveau mises à jour et fournissent des indices sur la manière dont Google traite les informations sur les entités qui peuvent avoir été initialement conservées dans le graphe de connaissances.

Comparaison des revendications à partir des citations de recherche des versions des brevets des entités

8 août 2017 – Systèmes et méthodes de recherche de cotations d'entités à l'aide d'une base de données :

REVENDICATIONS 1. Système informatisé de recherche et d'identification de cotations, le système comprenant : un dispositif de mémoire qui stocke un ensemble d'instructions ; et au moins un processeur qui exécute l'ensemble d'instructions pour : recevoir une demande de recherche d'un devis d'un utilisateur ; analyser la requête pour identifier un ou plusieurs mots clés ; faire correspondre le ou les mots clés à des éléments de graphe de connaissances associés à des entités de sujet candidates dans un graphe de connaissances stocké dans une ou plusieurs bases de données, le graphe de connaissances comprenant une pluralité d'éléments associés à une pluralité d'entités de sujet et une pluralité de relations entre les pluralité d'articles ; déterminer, sur la base des éléments de graphe de connaissances correspondants, un score de pertinence pour chacune des entités sujet candidates ; identifier, à partir des entités de sujet candidates, une ou plusieurs entités de sujet pour la requête sur la base des scores de pertinence associés aux entités de sujet candidates ; identifier un ensemble de citations correspondant à la ou aux entités sujet ; déterminer des scores de citation pour les citations identifiées sur la base d'au moins l'une des relations de chaque citation avec la ou les entités sujet, la récence de chaque citation ou la popularité de chaque citation ; sélectionner des citations parmi les citations identifiées sur la base des scores de citation ; et transmettre des informations à un dispositif d'affichage pour afficher les citations sélectionnées à l'utilisateur.

5 février 2019 – Systèmes et méthodes de recherche de cotations d'entités à l'aide d'une base de données :

REVENDICATIONS 1. Procédé comprenant les opérations suivantes effectuées par un ou plusieurs processeurs : réception d'un contenu audio depuis un dispositif client d'un utilisateur ; effectuer une analyse audio sur le contenu audio pour identifier une citation dans le contenu audio ; déterminer l'utilisateur en tant qu'auteur du contenu audio sur la base de la reconnaissance de l'utilisateur en tant qu'orateur du contenu audio ; identifier, sur la base de mots ou de phrases extraits de la citation, une ou plusieurs entités sujet associées à la citation ; stocker, dans une base de données, la citation, et une association de la citation aux entités sujet et à l'utilisateur étant l'auteur ; suite à la mémorisation de la citation et de l'association : recevoir, de la part de l'utilisateur, une requête de recherche ; analyser la requête de recherche pour identifier que la requête de recherche demande une ou plusieurs citations par l'utilisateur concernant une ou plusieurs des entités sujet ; identifier, à partir de la base de données et en réponse à la requête de recherche, un ensemble de citations par l'utilisateur correspondant à l'une ou plusieurs des entités sujet, l'ensemble de citations comprenant la citation ; sélectionner la citation parmi les citations de l'ensemble sur la base au moins en partie de la récence de chaque citation ; et transmettre, en réponse à la demande de recherche, des informations pour présenter le devis sélectionné à l'utilisateur via le dispositif client ou un dispositif client supplémentaire de l'utilisateur.

Comparez ces deux premières revendications à la première revendication de la dernière version du brevet, qui a été accordée plus tôt cette semaine. Il a quelques changements par rapport aux deux premières versions.

15 février 2022 – Systèmes et méthodes de recherche de cotations d'entités à l'aide d'une base de données :

REVENDICATIONS 1. Un système informatique, le système comprenant : un dispositif de mémoire qui stocke un ensemble d'instructions ; et au moins un processeur qui exécute l'ensemble d'instructions pour : récupérer une ressource électronique, la ressource électronique étant une page Web ou un document ; analyser la ressource électronique pour identifier un ou plusieurs mots clés ; faire correspondre le ou les mots clés à une entité sujet à partir d'une base de données d'entités sujet; identifier une pluralité de citations sur la base de l'entité sujet de la base de données d'entités sujet, dans lequel chaque citation de la pluralité de citations est identifiée à partir d'une ressource électronique supplémentaire comprenant une page Web ; identifier une entité sujet supplémentaire qui est associée à l'entité sujet de la base de données d'entités sujet ; sélectionner un sous-ensemble de la pluralité identifiée de citations sur la base du sous-ensemble des citations identifiées étant associé à l'entité sujet supplémentaire ; déterminer des notes de citation pour le sous-ensemble de citations identifiées, chacune des notes de citation étant pour une des citations correspondantes du sous-ensemble et étant déterminée sur la base d'un ou de plusieurs éléments parmi : une relation entre la citation correspondante et l'entité sujet, une récence du devis correspondant, et une popularité du devis correspondant ; sélectionner, sur la base des notes de devis, un devis parmi le sous-ensemble de devis identifiés ; et transmettre des informations à un dispositif client accédant à la ressource électronique, la transmission des informations amenant le dispositif client à afficher la citation sélectionnée et un hyperlien sélectionnable vers la page Web à partir de laquelle la citation sélectionnée a été identifiée.

Les titres des brevets n'ont pas changé et aucun auteur n'a été ajouté. Les dessins et la plupart des descriptions sont les mêmes.

  1. La première revendication fait référence à la « correspondance des mots-clés aux éléments du graphe de connaissances ».
  2. La deuxième première revendication n'inclut pas le graphe de connaissances et indique que le processus consiste à "effectuer une analyse audio sur le contenu audio pour identifier une citation dans le contenu audio".
  3. The Newest First Claim remplace le graphe de connaissances de la première version lorsqu'il indique qu'il « associera un ou plusieurs mots-clés à une entité sujet à partir d'une base de données d'entités sujet ».
  4. Contrairement aux deux premières versions, la Newest First Claim décrit comment rendre les informations de devis attribuables.

Il me reste donc des questions sur la recherche de devis d'entités

  1. Pourquoi une base de données d'entités sujet est-elle introduite, et pourquoi cela pourrait-il être différent du graphe de connaissances ? Il semble qu'il pourrait s'agir d'un thésaurus d'informations qui ne sont pas navigables et transparents pour les chercheurs comme pourraient l'être les informations du graphe de connaissances. Les autres informations sur les entités sont-elles également séparées du graphe de connaissances jusqu'à ce qu'il soit décidé de la meilleure façon d'afficher ces informations ?
  2. Où sont stockés les devis ? La deuxième première affirmation nous dit que le contenu audio est analysé au lieu de regarder dans le graphe de connaissances. Dans la troisième première revendication, la recherche de citations d'entités est effectuée en parcourant les citations dans la base de données d'entités sujet. Lorsque j'ai lu la deuxième version du brevet pour la première fois, j'ai compris que les informations sur les citations étaient conservées dans un index d'informations vidéo. Il est cependant probable que Google dispose d'informations sur certaines citations pour lesquelles il n'a pas nécessairement de vidéo.
  3. D'où proviennent les informations sur les devis ? La troisième première revendication nous indique qu'elle peut fournir au chercheur un "lien hypertexte sélectionnable vers la page Web à partir de laquelle la citation sélectionnée a été identifiée". Les deux versions antérieures indiquent que la citation peut être présentée à un chercheur, mais ne mentionnent en aucune manière l'attribution de la source de la citation ou des informations à son sujet. L'attribution semble désormais plus importante pour Google, où la deuxième première revendication semblait supposer que les informations pouvaient provenir de YouTube.

La dernière version du brevet de recherche de citations d'entités

Systèmes et procédés de recherche de cotations d'entités à l'aide d'une base de données
Inventeurs : Eyal Segalis, Gal Chechik, Yossi Matias, Yaniv Leviathan et Yoav Tzur
Cessionnaire : GOOGLE LLC
Brevet américain : 11 250 052
Attribué : 15 février 2022
Date de dépôt : 26 décembre 2018

Abstrait

L'invention concerne des systèmes et des procédés pour rechercher et identifier des citations en réponse à une requête d'un utilisateur.

Conformément à certains modes de réalisation, des systèmes et des procédés sont fournis pour identifier une ou plusieurs entités de sujet associées à la requête et identifier, à partir d'une base de données ou de résultats de recherche obtenus en réponse à la requête, un ensemble de citations correspondant à la ou aux entités de sujet.

En outre, des systèmes et des procédés sont fournis pour déterminer des scores de citation pour les citations identifiées sur la base d'au moins une des relations de chaque citation avec la ou les entités sujet, la récence de chaque citation et la popularité de chaque citation.

De plus, des systèmes et des procédés sont fournis pour organiser les citations identifiées dans un ordre de classement sur la base des notes de citation et pour sélectionner des citations sur la base de l'ordre de classement ou des notes de citation. De plus, des systèmes et des procédés sont fournis pour transmettre des informations afin d'afficher les cotations sélectionnées sur un dispositif d'affichage.

Rechercher des actualités directement dans votre boîte de réception

Ce champ n'est utilisé qu'à des fins de validation et doit rester inchangé.

*Obligatoire