SEO中的主题建模——排名更高的新方法
已发表: 2022-04-24SEO 中的主题建模是使用统计模型来发现文档集合中的主题。 通过检查数千个页面中单词和短语的共同出现,算法能够将主题相关性分配给页面并根据搜索查询对页面进行排名。

从关键字到主题
在搜索引擎的早期 - 1990 年代后期 - 算法所做的只是将结果中的关键字与查询中的关键字进行匹配。 搜索引擎不理解查询的上下文或关键字背后的意图。
但从那时起,搜索引擎已经走了很长一段路。 搜索引擎算法现在不仅能理解关键字,还能理解关键字背后的主题。 这种对主题而不是关键字的强调称为语义搜索引擎优化。
2013 年 Google 蜂鸟更新在理解主题方面取得了第一个重大进展。那时 Google 开始分析整个短语,而不仅仅是单个关键字。
2015 年 Google 的 RankBrain 算法向前迈出了一大步,该算法使用自然语言处理 (NLP) 来理解搜索查询背后的上下文和意图。
到这个时候,作为相关性衡量标准的关键词密度正在后视镜中迅速消失。 它正在被主题相关性所取代。 您现在在 Google 上的排名如何取决于您的内容涵盖该主题的全面程度。
从那时起,谷歌和其他搜索引擎在理解主题方面越来越好。 他们通过一种称为主题建模的技术来做到这一点。
主题建模与主题分类
主题建模是一种统计方法,用于发现单词和短语之间存在的关系。
通过主题建模,该算法可以在无监督的情况下发现信息本身的类别。 它通过扫描一组文档并根据单词和短语与其他单词和短语一起出现的频率对它们进行聚类来做到这一点。 主题建模是一种“无监督”学习技术:算法根据发现的模式自行发现类别。
主题建模与主题分类不同,后者是一种机器学习技术,人类必须通过给定规则来“训练”算法。
使用主题分类,您首先需要定义要使用的信息类别。 然后,您为算法提供了一些原始数据示例,这些示例已使用这些预定义类别进行了标记。 然后,该算法使用这些预定义的类别来分析数据。
这两种技术的区别在于:在主题分类中,人类告诉算法类别是什么,而在主题建模中,算法通过对单词和短语如何以特定模式聚集在一起的统计分析来发现类别是什么。
这些文本分析方法不仅被搜索引擎使用,而且被整个互联网使用。
例如,收到大量在线客户反馈的企业可能会使用主题建模或主题分类将其反馈分类,例如购买后通知、体验跟进、品牌忠诚度反馈、客户投诉和客户评论。
两种类型的主题建模
到目前为止,我一直在使用术语“主题建模”,就好像它是一个单一的东西一样。 但它实际上是一个涵盖一系列不同技术的总称。
现在让我们看看一些不同类型的主题建模。
潜在狄利克雷分配 (LDA)
潜在狄利克雷分配(LDA)基于两个假设:相似的主题使用相似的词,并且文档讨论了可以检测到统计分布的几个主题。
LDA 通过将主题分配给诸如 n-gram 之类的单词排列,将文档映射到主题列表。 n-gram 是自然语言处理中使用的单词序列。
指示符“n”指的是 n-gram 中的单词数。 其中 N=1,n-gram 包含一个单词,其中 N=2,n-gram 包含两个单词,依此类推。
例如,句子“The cow jumps over the moon”将包含以下 2 个单词的 n-gram(称为 bi-gram):
- 牛
- 牛跳
- 跳过
- 超过
- 月亮
一旦你有了 n-gram,你就可以进行计算来预测某些单词出现在同一个句子或同一个段落中,或者彼此相距一定距离的可能性。
潜在狄利克雷分配假设文档由特定的单词排列组成,并且这些排列决定了文档的主题。
潜在语义分析
与 LDA 一样,潜在语义分析基于分布假设:可以通过查看单词出现的上下文来掌握单词的含义。 正如英国语言学家 JR Firth 所说:“您将通过它所拥有的公司知道一个词”(Firth, JR 1957:11)。
与将主题分配给特定单词排列的 LDA 不同,潜在语义分析只是计算单词在一组文档中出现的频率。 它假设属于相似主题的文档将包含某些词的词频分布大致相同。
它用于计算词频的方法是词频-逆文档频率或 tf-idf。
词频 (TF) 是指关键字在单个文档中出现的次数。
逆文档频率 (IDF),衡量该术语在文档集合中出现的次数。
然后将词频 (TF) 除以逆文档频率 (IDF) 以获得 TF-IDF 值。
LDA 和 LSA 都是无监督技术。
主题集群 - 排名更高的关键
如您所见,搜索引擎正在将注意力从关键字转向主题。 他们正在使用各种统计方法来识别某些单词与其他单词一起发现的模式。 这些模式允许搜索引擎识别主题。
这就是为什么主题集群现在是搜索结果中排名靠前的重要部分。
Google 希望提供权威的搜索结果。 这意味着提供在深度和广度上很好地涵盖某个主题的内容。
支柱帖子和主题集群
最好的方法是使用主题集群模型。 那是一组页面,其中有一个称为支柱的中心页面。 支柱帖子深入涵盖了该主题,通常至少有 3000 字长。
在支柱帖子中,您涵盖了与您的主题相关的所有子主题。 但是您不一定要非常详细地讨论这些子主题。 花几段介绍每个子主题,然后链接到单独的博客文章,在其中更详细地介绍该子主题。
例如,您的支柱帖子可能是关于“花园工具”的。 那将是一篇比一般文章更长的文章,您将在其中简要描述所有主要类型的园艺工具:割草机、剪线机、绿篱机、修枝剪、覆盖机、吹叶机、磨边工具、洒水器等。
然后,您将为每个子主题创建一个单独的内容,并从支柱帖子链接到这些文章。
为什么主题集群有助于 SEO?
主题集群如何帮助您获得更高的排名? 它向搜索引擎显示您的网站对特定主题具有主题权限。 当您创建主题集群时,您的内容将充满相关的关键字。 这正是搜索引擎算法现在正在寻找的东西。 一个网站有十或十五页密切相关的内容,其中充满了通常一起找到的关键字,将从算法中获得绿灯。
到目前为止,在本文中,我们已经研究了为什么主题取代关键字成为 SEO 的重点,以及搜索引擎如何使用各种主题建模工具来理解主题及其子主题。
作为内容创建者,您可能想知道是否有主题建模工具可以帮助您“绘制”特定主题,以便您可以创建全面涵盖该主题的内容。
好吧,毫不奇怪,这样的工具已经存在。 在下一节中,我将向您展示其中的两个。
主题建模工具
本节为您提供两个主题建模工具的演练,它们将帮助您编写具有高主题权威的内容。
市场缪斯
MarketMuse 是一个人工智能驱动的内容研究和关键字规划工具。 它使用机器学习和人工智能来分析内容,建议要涵盖的主题,并制定简报以帮助您创建更好的内容。
当您登录 MarketMuse 时,您会在左侧菜单中看到五个工具:研究、竞争、优化、问题和连接:

让我们一一看看这些工具。
研究工具
在研究工具中,输入您的关键字,MarketMuse 将确定该关键字的主要主题:

主题出现在左侧列中。 在右侧栏中,您将看到每个相关主题的估计搜索量,以及显示该主题搜索趋势的图表。
最右侧的列显示了您应该在内容中提及该相关主题的建议次数。 MarketMuse 为此使用了颜色代码:
- 黄色 = 1 到 2 次提及
- 绿色 = 3 到 10 次提及
- 蓝色 = 10+ 次提及
您可以通过单击主题深入了解每个相关主题。 您将看到该主题的变体列表:

在您的内容中包含这些变体将帮助您对多个关键字进行排名。 它还将增加您文章的主题权威,因为搜索引擎现在知道某些单词一起出现在深入涵盖某个主题的内容中。
竞争工具
Compete 工具通过分析数千个文档来创建主题模型。 然后,它根据该模型分析前 20 个结果,并将结果显示为热图。
竞争用于评估和分析给定主题的竞争,并就您希望对该主题的覆盖范围做出决定。
Compete 的热图可帮助您快速了解比赛如何接近您想要撰写的主题,您需要包含哪些相关主题,以及您应该涵盖哪些主题以使您的内容脱颖而出:

在竞争屏幕的顶部,您将看到该主题的前 20 个搜索结果。 每个搜索结果下方是该文章的 MarketMuse 内容分数。 这是由 MarketMuse 开发的专有分数,显示页面涵盖主题的程度。
热图上的颜色代码向您展示了每条内容对主题的覆盖程度:
- 红色 = 0 次提及
- 黄色 = 1-2 次提及
- 绿色 = 3-10 次提及
- 蓝色 = 10+ 次提及
评估页面覆盖主题的快速方法是垂直向下扫描一列:

同样,您可以通过水平扫描一行来查看比赛如何涵盖特定主题:

在竞争工具中寻找的另一件事是内容分数。 这些使您可以一目了然地看到排名靠前的内容对该主题的覆盖程度:

如果分数较低,则表明您很有可能通过经过充分研究的内容获得该主题的高排名。
在竞争屏幕的左侧,您将看到构成主题模型的所有主题。
使用竞争工具时,有两件事需要寻找:必备主题和主题空白。
必备主题是在搜索结果中排名靠前的页面中始终存在的主题。 为了表现出色,这些主题必须包含在您的作品中。
主题空白是竞赛未涵盖的主题。 它们是通过包含竞争对手缺少的主题来优化您的内容的绝佳机会。
优化工具
优化工具是一个文本编辑器,可以为您提供有关您的内容涵盖某个主题的程度的实时反馈。 只需输入您的关键字和文章的 URL,MarketMuse 就会显示

右侧面板中的颜色代码显示您使用该术语的次数以及您应该使用该术语的次数。

当您向内容片段添加建议的术语时,颜色代码将更新以表明您正在接近该术语的最佳提及次数。
当您向下滚动页面时,“Feed”选项卡可让您对您的内容解决主题的效果进行持续评估:

在竞争屏幕的顶部,您会看到一个状态栏,告诉您您的内容分数、平均分数、目标分数、字数、平均字数和目标字数:

问题工具
当您处于撰写文章的研究阶段时,MarketMuse 中的问题工具非常有用。 它向您显示与您的主题相关的最常见问题:

在您的内容中包含相关问题是提高文章主题权威的另一种方式。
在屏幕的右侧,您会看到一个带有“Run in”按钮的列。 这使您可以选择在其他四个工具之一中运行每个问题:

MarketMuse 是一个强大的工具,用于分析主题并确保您的作品内容涵盖尽可能多的主题。 MarketMuse 之所以特别有用,是因为它基于该特定关键字的排名靠前的结果。
它不仅向您显示排名在搜索结果顶部的页面涵盖了哪些主题。 它还向您显示主题空白。 通过解决主题空白,您可以使您的内容从其他页面中脱颖而出。
文章见解
Article Insights 是另一个主题建模工具。
它可以帮助您识别出现在特定主题的前 10 个搜索结果中的关键字。 它通过将您的内容与竞争对手的内容进行比较来帮助进行竞争对手分析,这样您就可以看到他们使用了哪些关键字而您没有使用。 它通过将关键字标记为人、产品、公司或地点来帮助进行实体检测。
您需要在 Article Insights 中做的第一件事是创建一个项目。 为您的项目命名,然后添加您要定位的关键字:

然后关键字进入处理队列 - 完成分析可能需要几分钟。
处理完关键字后,您需要单击“查看”按钮。
然后,您将看到一个由两部分组成的屏幕:左侧的书写界面和右侧的分析:

在文章编辑器中,您有两个选项卡:“文章”和“摘要”:

简介是您可以留下有关文章的注释的地方。 有一个分享按钮,您可以在其中获得与您的作家分享文章的链接。
右侧是一个面板,其中包含您内容的所有分析:
这些包括:
- 字数
- 您在文章中使用的关键字
- 您的竞争对手使用过的关键字(差距分析)
- 您使用的标题和竞争对手使用的标题数量。
- 您的内容的独特性
- 可读性分数
您可以从头开始编写文章,也可以从 URL 导入正在编写的文章:

在文章编辑器中加载内容后,该工具会根据该关键字的前 10 个搜索结果分析您的内容:

- 面板 1 和 2向您展示了您的文章的完整性以及您应该瞄准的字数。
- 面板 3显示您的内容中使用的前 15 个关键字。
- 面板 4向您展示了您的竞争对手使用的关键字以及您使用了多少。
- 面板 5显示您使用的标题,并将它们与竞争对手使用的标题进行比较。
标题面板下方是一个显示“独特性”分数的面板和一个为您提供 Flesch 阅读分数的工具:

“独特性”工具包含一个名为“文章重写”的按钮。
单击它会打开文章编辑器,其中包含有用的同义词建议,您可以使用它来重写您从“研究”选项卡添加的片段。 将光标悬停在任何突出显示的单词上,该工具会为您提供该单词的替代同义词:

这非常有用,可以帮助您快速重写您的内容。
右侧面板的顶部是七个选项卡。 到目前为止,我们一直在使用“分数”选项卡。
如果您单击竞争对手选项卡,您将看到该关键字的前 10 名竞争对手的列表,以及每个竞争对手的关键字分组。 这些关键字分组显示每个竞争对手使用的热门关键字:

您可以选择和取消选择竞争对手,这在您认为与您的内容不相关的结果时很有用。
下一个标签是“研究”。 此选项卡从排名靠前的内容中提取片段:

单击一个研究片段,它将被添加到文章编辑器中。 然后,您需要重新编写它以使其成为您自己内容的一部分。
下一个标签是“标题”。 此选项卡显示用于您选择的每个竞争对手的标题。 您可以准确地看到他们的页面上有多少标题,以及标题的级别。

接下来是“问题”选项卡。
此选项卡从 Google 中提取与您的主要关键字相关的问题。 这些是您可以添加到文章中以获得主题权威的子主题:

下一个选项卡是“主题”。 此工具向您显示相关的关键字,按主题分组。 与这些主题匹配的段落将放置在该主题面板中:

主题大纲可帮助您发现可以轻松添加到段落中的相关关键字。 将这些相关词添加到您的段落中将增加您内容的主题权威,并大大提高您文章的质量。
最后一个选项卡是“重复项”。 此工具可检测您的内容中重复的片段。 您需要重写此工具标记为红色的任何内容。
现在让我们回到“分数”标签中的关键字面板,因为它有一个有用的功能。 单击该面板中的关键字:

然后,该关键字将在“竞争对手”选项卡中突出显示。 然后,您可以查看您的竞争对手使用该关键字的次数:

相同的关键字也将在“研究”选项卡中突出显示:

当您尝试针对特定关键字优化内容时,这是一个有用的功能。
结论
随着算法不再关注关键字并尝试理解主题,您的内容全面涵盖主题变得越来越重要。
这正在成为在搜索结果顶部排名的关键。
在本文中,我们研究了搜索引擎现在使用的各种主题建模技术,以更好地理解文档和一组文档中单词的共现。
我们已经看到搜索引擎如何使用文档中相似关键字的出现、频率和接近度来理解主题。
理所当然地,如果搜索引擎使用这些工具来理解主题权威,内容创建者需要使用相同的技术来确保他们的内容正确地涵盖一个主题。
这就是 MarketMuse 和 Article Insights 等工具的用武之地。它们使用 AI 来分析您正在撰写的主题,并向您展示该主题中的子主题是什么,以及您应该使用哪些关键字来对该主题进行良好排名。
相关资源
- 主题集群和 SEO – 构建内容中心的 5 个简单技巧
- 语义 SEO - 初学者指南
- 通过 5 个简单的步骤在您的网站上创建筒仓结构
- 什么是潜在语义索引:7 个重要事实
- 什么是 LSI 关键字以及如何使用它们来排名更高