Google SERP 中的集群实体已更新
已发表: 2022-01-13集群实体专利更新
我最新的一篇博文是关于 Google 在自然搜索结果中按主题对新闻结果进行聚类。 谷歌也对搜索结果中的实体信息进行了聚类。 如果您现在搜索在卡萨布兰卡与汉普莱·鲍嘉一起表演的人。 您可以在这些搜索结果中看到该电影中的其他演员。 您还可以查看包括这些演员和电影的相关问题(以及关于电影相关类别的本体)。 这篇新文章是关于实体聚类的,并改变了 Google 提供与实体聚类相关的搜索结果的方式。
以下是显示演员与电影《卡萨布兰卡》之间联系的搜索结果示例:
Google 从 2022 年 1 月 3 日起拥有一项延续专利。我曾在 2019 年的 Google 搜索结果中的实体聚类一文中写过该专利的早期版本
第一项专利的权利要求
由于这项新专利是延续专利,因此大部分专利是相同的。 该专利包含更新的权利要求。 2019 版聚类搜索结果专利的第一项声明如下:
1.一种方法,包括: 确定响应于查询的项目; 生成项目的第一级集群,每个集群代表知识库中的一个实体,并包括映射到该实体的项目; 计算每个第一级聚类的相应聚类分数,其中第一级聚类的相应聚类分数基于测量第一级聚类的连贯性和分离度的相应轮廓分数和代表百分比的轮廓比率具有高于阈值的相应轮廓分数的所有第一级集群; 基于实体本体关系和为合并的集群计算的各个集群分数来合并第一级集群,其中合并集群的各个集群分数表示比包含在合并集群中的第一级集群的各个集群分数更好的分数; 将层次聚类应用于合并的聚类,生成最终聚类,使分层聚类的各个聚类得分最大化; 并且提供响应于查询的项目以根据最终聚类显示。
更新专利的权利要求
详细地说,我在 2019 年写的帖子描述了集群实体专利背后的过程。 现在,从 2022 年第一天开始的新版本专利采用了一种新语言,可以告诉我们专利的作用。 1999 年的第一组索赔告诉我们一个“剪影分数”,这不在新的索赔中。 2022 年的声明包括一些 2019 年版本中没有的术语:
1.一种由搜索引擎执行的方法,包括: 响应查询确定一组项目; 对于确定为响应查询的一组项目中的每个项目:识别与该项目相关联的一个或多个实体,并获得该项目的嵌入; 从项目集中生成第一级集群,每个集群代表一个或多个实体中的一个实体; 通过合并基于实体本体关系的第一级聚类和使用项嵌入确定的嵌入相似性来生成最终聚类,其中实体本体关系包括上位词、同义词和同义词; 以及提供来自响应于查询的项目集合中的项目以根据最终聚类显示。
2.如权利要求1所述的方法,其特征在于,首先合并较小的第一级集群。
3.如权利要求2所述的方法,其特征在于,对于第一第一级集群,合并较小的第一级集群包括:确定第二第一级集群和与所述第一第一级集群相关的第三第一级集群。基于实体本体关系; 确定第三一级簇和第一一级簇小于第二一级簇; 将第一级集群与第三级集群合并。
4.如权利要求1所述的方法,其特征在于,最相似的第一级聚类首先被合并。
5.如权利要求4所述的方法,其特征在于,对于第一一级聚类,首先合并最相似的第一聚类包括: 确定第二一级聚类和与所述第一一级聚类相关的第三一级聚类。实体本体关系; 确定第一一级聚类与第二一级聚类比第三一级聚类更相似; 将第一级集群与第二级集群合并。
较新的版本告诉我们它包括“本体关系”,而第一组声明没有。 因此,我们从 SERP 中得知 Bogart 出现在电影《卡萨布兰卡》中,许多其他关注该搜索结果的演员也是如此。
聚类搜索结果
发明人:陈吉林,戴; Lichan Hong、Tianjiajia Zhang、Huazhong Ning 和 Ed Huai-Hsin Chi
受让人:谷歌有限责任公司
美国专利:11,216,503
授予:2022 年 1 月 4 日
提交日期:2019 年 11 月 26 日
抽象的
实现方式提供了一种改进的系统,用于基于搜索项的实体关联来呈现搜索结果。 示例方法包括响应于查询生成项目的第一级集群,每个集群表示知识库中的一个实体并包括映射到该实体的项目,基于实体本体关系合并第一级集群,将层次聚类应用于合并集群,生成最终集群,并根据最终集群启动项目显示。 另一个示例方法包括从响应于查询的项目生成第一级集群,每个集群表示知识库中的一个实体并包括映射到该实体的项目,通过基于实体本体和从使用映射的嵌入模型生成的嵌入空间,并根据最终集群启动响应于查询的项目的显示。
如果你回到我在 2019 年对这个集群实体专利的原始文章,你会看到我在写实体时多次提到“本体”。 2022 年版本的集群实体专利将这种语言直接添加到权利要求中。 他们在 SERP 中没有讨论电影与其演员之间的关系。
集群实体和新闻
在此更改之后,当我们搜索特定实体和新闻时,我们也会在那里看到聚集的搜索结果:
因此,谷歌不再根据匹配文档对查询词的好坏对 SERP 进行排序——谷歌正在对主题和实体之间的关系进行聚类,作为其决定在搜索结果中包含哪些内容的一部分。
直接在您的收件箱中搜索新闻
*必需的