段落索引:来自 Google 的新排名算法

已发表: 2022-05-09

从 2021 年开始,您的 Google 搜索体验将焕然一新,因为这家搜索引擎巨头推出了一个排名因素——段落索引。

新排名技术于 2021 年 2 月 11 日正式推出。正式推出的确认来自 Google SearchLiason 推特账号:

[推广横幅=“3”]

什么是段落索引算法?

段落索引是谷歌算法使用的一项新技术,它可以根据用户的搜索查询对搜索结果页面内的单个段落进行排名。

还记得谷歌在 2019 年 9 月发布的关于 BERT 的公告吗? 他们说 BERT 将影响 10% 的英语搜索查询。 现在,不管你信不信,它实际上影响了超过 99% 的查询。

段落索引将对搜索结果页面产生类似的连锁反应,因为 Google Crawlers 将开始了解您内容中特定段落的相关性。

虽然它被称为 Passage Indexing,但在 Google 当前的索引过程中并没有发生重大变化。 然而,新技术更多地与排名有关。

所以,这字面意思是,如果你有关于站外 SEO 的长篇内容,并且你有关于每个站外 SEO 策略的单独段落,谷歌现在将对与搜索查询匹配的内容的各个部分进行排名.

自成立以来,Google 一直在朝着提高搜索结果相关性和上下文的方向发展。 您现在可以看到,两个核心排名因素——内容和链接——只有在补充相关性时才有价值。 谷歌关于段落索引

谷歌关于 Passage Index 的官方公告称,搜索算法现在可以最精细地理解页面内内容的相关性。

这意味着即使与搜索查询相关的答案深藏在页面中,Google 也可以为您挑选特定的段落。 这家搜索巨头表示,它现在能够找到“你正在寻找的大海捞针信息”。

Passage Index 将影响全球 7% 的搜索查询。 既然我们面前有 BERT 的例子,这个百分比肯定会在一年的时间内达到指数水平。

段落索引侧重于排名不显示

让我让您轻松理解段落索引的概念。

首先,段落索引与 Google 将在哪里显示结果无关。 这是一个额外的排名因素,使 Google 能够理解页面中的各个段落。

因此,这意味着段落索引将就像 BERT 或链接分析算法一样。 它与其他排名因素协同工作,为用户带来更好的结果,而不会对 SERP 的整体外观和感觉做出太大改变。

关于段落索引的混乱是由于谷歌的一个坏例子造成的,丹尼沙利文在他的一条推文中证实了这一点。

这是一个有趣的示例,可以了解段落索引算法的工作原理:

考虑您想要将其列为具有多个章节的书的页面。 到目前为止,谷歌过去常常根据您所涵盖的主要主题对这本书进行排名。

但是通过段落索引,Google 可以理解您书中的各个章节。 因此,这意味着当在搜索中输入高度相关的查询时,您的各个章节(页面的部分)将显示在结果中。

这意味着您现在不需要做任何事情来使您的页面通道索引友好,因为它更多的是内部排名变化。

但是,结构化您的内容可能会使 Google 的段落索引算法更容易更好地理解文本的含义。

因此,如果您是编写具有多个子标题的长篇内容的人,并且您没有看到这些文章的有机吸引力,那么段落索引是一个福音。

早些时候,具有精细内容的页面无法排名,因为主要主题可能很广泛。

但是通过段落索引,这种长格式页面现在可以针对上下文相关的相关查询进行排名。

因此,如果您正在运行电子商务网站,您的产品页面可能无法从段落索引中受益,因为内容通常是重点。

段落索引算法如何工作?

段落索引在行动

段落索引不会改变抓取和索引过程,但它会帮助 Google 理解页面中段落的含义。

这意味着谷歌将不会独立索引个别段落。 每当输入查询时,Google 将根据相关性和含义在结果中显示最合适的段落。

如果您对基于长尾问题的搜索查询进行快速 Google 搜索,您最终可能会看到包含网站列表的结果。 但是您想要的是对您的问题的具体答案,而 Google 以前无法提供。

但是,通过段落索引算法,Google 搜索将为您获取与您的查询最相关的答案。

有趣的是,为您提供答案的页面可能包含长篇内容,但 Google 只是通过向您显示与上下文最相关的答案来节省您的时间。

以下是 Google 关于段落索引的官方说法:

因此,例如,假设您搜索非常利基的内容,例如“我如何确定我的房屋窗户是否是紫外线玻璃”。 这是一个非常棘手的问题,我们有很多网页都在谈论 UV 玻璃以及如何需要特殊胶片,但这些都不能真正帮助外行采取行动。 我们的新算法可以直接放大回答问题的 DIY 论坛上的这一段落。 显然,您可以使用火焰的反射来判断和忽略页面上其他不太有用的帖子。

谷歌只是要索引部分页面吗?

谷歌官方已经确认 Passage Index 不会取代正常的页面索引。 这意味着谷歌的爬虫将继续完全索引页面,但在这样做时,它会尝试理解内容和内容中每个段落的含义。

这并不意味着谷歌索引页面的方式发生了变化。 尽管如此,它还是在现有流程中添加了另一层,这当然会改变页面的排名。

就 SEO 而言,这很重要,因为通道索引算法将带来排名和结果显示方式的范式转变,而不是索引更改。

精选片段和段落索引之间的区别

根据 Google 的说法,精选片段结果是来自具有整体主题相关性的页面的段落。

但是,段落索引不考虑页面的整体相关性,而只考虑段落与搜索查询的相关性。

谷歌的丹尼沙利文也在推特上发表了同样的言论,“精选片段用于语音搜索。 它们已经使用不同于段落的系统来识别。”

Google 是否使用 SMITH 语言处理进行段落索引?

我们听说 BERT 能够理解搜索和单个页面中的长查询。 但现在,谷歌似乎释放了一种巨齿鲨,它的代号为 SMITH。

SMITH 代表 Siamese Multi-depth Transformer-based Hierarchical (SMITH) Encoder,这是一项已申请的新自然语言处理专利。

这种新的语言处理模型旨在让 Google 算法理解页面中的段落。

所以,现在我们知道了谷歌在不久的将来如何使用通道索引的路线图。

在 Google 关于 SMITH 的文档共享中,它说,语言处理系统将有助于推荐新闻文章、相关文章,以及重要的聚类文档。

关于文档聚类的第三点是一个重要方面,因为它与段落索引直接相关。

它还说,SMITH 是一个长篇文档匹配系统,它再次指向 Google 发布的 Search On 公告以及 Danny Sullivan 的推文,即长篇内容将如何从 Passage Indexing 中受益。

它的工作原理与 BERT 几乎相似。 虽然 BERT 使用掩码词语言建模,但 SMITH 通过掩码句子块来提升这一点。

根据谷歌的说法,他们“在长篇文档匹配的几个基准数据集上的实验结果表明,我们提出的 SMITH 模型优于以前的最先进模型,包括分层注意力、基于多深度注意力的分层递归神经网络、和 BERT。”

当您将 SMITH 与 BERT 进行比较时,前者具有处理更多单词的能力,据 Google 称,这有助于提高匹配文档的能力。

“与基于 BERT 的基线相比,我们的模型能够将最大输入文本长度从 512 增加到 2048,”谷歌专利说。 需要注意的是,BERT 的最大输入文本长度为 512 个单词。

这就是史密斯付诸行动的方式:

步骤 1:将文档拆分为多个句子块

第 2 步:语言处理 Transformers 将学习每个句子块的上下文表示。

第 3 步:然后按照 BERT 中的做法,在上下文中表示整个句子块。

第 4 步:给定一系列句子块表示,文档级 Transformer 学习每个句子块的上下文表示和最终文档表示。

猜测:我们是否正在进入内容优化 2.0?

Passage Indexing 将改变 Google 显示搜索结果的方式,在未来的日子里,SEO 似乎还有很多工作要做。

谷歌认为元标题和标题标签是理解内容上下文的基本信号。 但那是在他们推出 Passage Indexing 之前。

通过段落索引,谷歌已经开始通过独立理解段落的含义来索引页面。 因此,各个段落现在可以针对相关搜索查询进行排名。

更有趣的是,即使页面讨论了一个不太相关的主题,如果用户查询的答案隐藏在任何段落中,该页面也会出现在搜索中。

查看与 Google 员工有关 Passage Indexing 的各种讨论,显然 Passage Indexing 将产生更大的影响。

例如,在办公时间的讨论中,John Mueller,后者说,段落索引的结果现在可能会出现在特色片段区域中,但随着时间的推移,段落索引将决定正常的搜索结果。

约翰说:

所以可能是我们首先在特色片段中展示这些,因为我不知道我们展示了那个例子,或者这可能是我们可以检查这个的最清晰的方法。 然后在某个时候,我们也开始在正常搜索结果中更多地显示它们。

这是一个重要的声明,因为我们知道 Google 很长一段时间以来一直在淡化元描述,并且通道索引很有可能会控制未来元描述中出现的内容。

除此之外,我个人认为元描述的字符限制不会增加以容纳整个段落。 相反,谷歌可能会做的是将滚动到已经在特色片段结果上实现的文本功能扩展到元描述。

这样,用户可以导航到页面中回答他们问题的确切段落。 但是,如果您依赖广告收入,那么此功能将对您的收入产生重大影响,因为用户将

我认为这很快就会成为现实的另一个原因是,谷歌有在大规模推出之前对 SERP 功能进行小规模测试的历史。

当前段落索引结果代替特色片段和滚动到文本功能的示例可以被吹捧为分析的一部分,以了解它们对用户有多大用处。

John 对 Glenn Gabe 关于段落索引是否只会为精选片段提供更好的答案的问题的回答本身就揭示了段落索引对 Google 的重要性。

以下是约翰的回答:

所以我有点退后一步,只是用我的内部信息猜测这个。 通常情况下,我们会在一个特定的地方推出它们,进行一些试验以找出如何最好地实现这些,它们如何最好地工作,然后找到更广泛地推出的方法。

但又有点像搜索中的所有这些新变化。 通常,我们会在小范围内尝试它们,然后随着时间的推移将它们扩大一点。

即使 Google 是否将段落索引限制在精选片段区域,您也可能会发现零点击查询的数量有所增加。

发生这种情况是因为用户在 SERP 上获得了最佳的上下文相关信息,并且他们无需访问已策划内容的网站。

因此,一旦段落索引上线,请密切关注您收到的印象和点击。 此外,Search Console 很有可能会为段落索引添加增强功能并展示新功能产生的点击。

这也意味着搜索引擎优化现在可以停止关注关键字,并为主题相关性和结论性提供更多动力。

在推出 Passage Index 后,了解用户的担忧并通过内容解决方案解决这些问题将对网站的成功起到重要作用。

我的意思是,对一个特定主题采取整体方法的长篇内容有机会从新的段落索引算法中受益。

多亏了谷歌的自然语言处理算法——BERT,理解每个段落的含义和相关性对于搜索引擎巨头来说不再是一项麻烦的任务。

有时,如果您查看 Google 提出的算法和功能,您会看到它们工作方式的同步性,以及它们如何支持实现 Google 的原始目标,即为给定的搜索查询为用户提供最佳结果。

[推广横幅=“4”]