什么是 BERT SEO 和自然语言处理?
已发表: 2020-02-12由于 BERT,自然语言处理 (NLP) 是每个移动 SEO 活动中必不可少的新要素。
您可能听说过“言出必行”这句谚语。 同样,在搜索营销中,我们如何在页面上使用单词也很重要。 Google 的 BERT 提供了有关其搜索结果组织的见解。 它说明了单词实体和语言使用之间的关系如何塑造 SEO 的未来。
移动优先索引会影响 Google 对搜索者的物理(GPS / Google 地图)位置的依赖性增加。 它还知道搜索者在手机和 Google 帐户中的语言设置。 这有助于通知返回的搜索结果并提供更个性化的搜索结果。
谷歌一发布声明,宣布 BERT 算法影响搜索格式,我们就知道这值得时间和关注。 由于它旨在改进对复杂长尾搜索查询的解释并显示更多相关的搜索结果,这是 5 年来最大的搜索更新。 只有将 BERT 所包含的词的实际含义内化后,我们才能更好地进行搜索营销。
这是我们今天所达到的。
什么是 BERT?
BERT,是来自 Transformers 的双向编码器表示的首字母缩写词。 它是一种基于神经网络的自然语言处理预训练技术。 简单来说,它可以用来帮助搜索引擎更好地破译搜索查询中单词的上下文。
BERT 模型超越了以前的能力。 他们通过查看单词前后的两个单词来评估单词的完整上下文。 这有助于它收集对于理解提示搜索查询的意图特别有用的上下文。
什么是 Google 实体?
谷歌于 2016 年 10 月 25 日获得专利号为 US 9,477,759 B2 的专利。它将谷歌实体定义为:“单一、独特、明确定义和可区分的事物或概念。” 它还解决了依赖于非结构化数据中的实体引用的问答能力。 该专利解释了谷歌如何在网页中找到相关信息。
重要的是要了解实体不一定是物理对象,它也可以是色调、日期、香味等。 实体是任何事物:单一的。 例如,实体可以是个体、物理建筑、地理位置、产品项目、声音、认知想法、抽象概念、事实元素或其他存在的事物。 它也可以是这些的任意组合,以帮助 Google 如何抓取网站并将其编入索引。
实体不属于父节点; 相反,它的后代是只读的。 实体的名称保存在nodeName
属性中。 此外,Entity 是一个 Node 对象,因此继承了它的一些属性和方法。
什么是实体识别?
实体识别是将搜索从字符串提升到事物的原因。 它帮助 Google Search Appliance 识别和分类文档中感兴趣的实体,然后将这些实体存储在其库或搜索索引中。 SEO 可以丰富元数据贫乏的内容,从而增加使用 NLP 通过文本赢得丰富结果的机会。 术语可以是实体的名称,之后称为“命名实体”。
什么是实体查询匹配?
实体查询匹配扩展了 Google 先进的内容感知能力。 如何在现场优化中使用 NLP 已成为 2020 年的首要问题。从广泛的市场调研开始每一次内容营销活动。 这将帮助您了解搜索引擎可能与每个主题的用户查询相关联的上下文。
如何知道哪些页面足够可信,可以看到 NLP 优化的结果?
如果您已经拥有有关某个主题的优质内容并对其进行排名,那么您就有更好的机会。 找到一个内容薄弱但可能由于入站链接而排名的页面,然后从改进这些页面开始。 如果用自然语言编写,您的内容将更好地满足真实观众的需求。
什么是基于上下文的自然语言处理?
基于上下文的自然语言处理从搜索引擎如何尝试识别可用于匹配特定用户请求的上下文开始。 它涉及通过利用依赖于上下文的对话系统引擎来处理此类用户请求。 这些通常引用语音上下文,这些语音上下文源自一系列用户请求或对话系统答案,这些答案被存储和分类
搜索营销人员如何使用 NLP 来增加收入?
结构化数据反映了您的内容是关于什么的。 如果它被正确实施并保持最新,它应该这样做。 对于电子商务网站,包括可以回答具有购买意图的搜索查询的上下文内容。 避免使用可能具有负面含义的 NLP 实体,例如“沮丧”或“疯狂”。 它需要有大局而不是价值观本身。 这将有助于破译实体中的细微差异。
搜索结果页面,称为 SERP,非常受欢迎。 正确的内容可以帮助您的业务在 Google 的本地包和精选片段等功能中脱颖而出。 通过采用以 BERT 为中心的思维方式,您的企业甚至可以通过零点击搜索赢得客户的来电。 在您的内容发布工作流程中添加语义处理涉及使用自然语言处理来添加描述您的内容的有用的语义结构化信息。 许多搜索策略可以包括 NLP 以提高 SEO 和用户参与度。
自然语言处理领域正在飞速发展。 结合机器学习并在深度学习技术的驱动下,出现了单词使用模式。 实体和节点从大量文本中生成内容结构。 然后谷歌选择它想要的方式来使用它们。
谷歌知识图显示相关实体。 广为人知的人的知识面板可能会显示适合您的搜索查询的该人与另一个人之间的联系。 通过单击“查看连接”,将填充包括两个人在内的更多信息。 要自己进行实验,请搜索您最喜欢的名人,然后在“人们也在搜索”SERP 结果中选择建议的名人。 这是触发这些相关实体节点的一种方式。
会话式 AI 聊天机器人和语音助手依靠最先进的自然语言模型在业务不可用时回答人们的问题。 可以对这些模型进行训练,以促进以消费者为中心的方法来回答常见问题。
每个企业都需要关心 Google 搜索实体吗?
是的,那些想要在自然搜索中找到的人。 您如何在内容中使用实体的目标应该包括激励人们采取与您的业务目标直接相关的行动。
准确代表您的企业名称和实体有助于客户在线找到您的企业。 首先是一个完全优化的 Google 我的商家列表,其中填写了所有实体。
他们可能永远不会这样想。 您手机上的麦克风始终在监听。 在后台,机器学习正在评估它从接收到的实体中听到的信息。 最新版本的 iPhone 和 Android 会显示到它最后听到你说话的地方的距离。 或者在哪里看到它最后听到的在您收听的广播/电视广告中宣布的电影。 它还在听什么?
安装在我电脑上的 Cortana 最近多次对我说:“如果我能熟悉你说话的方式,我就能更好地理解你。” 然而,我并没有和它说话,也没有认为它在“听”。
在过去的几个月里,我们看到越来越多的证据表明,谷歌的移动优先索引不仅仅是主要爬虫的变化,而是谷歌组织信息和处理查询的战略的重大转变。 移动优先索引中的语言和实体之间的关系,‘实体优先索引’,怎么强调都不为过。” – Mobile Moxie 的 Cindy Krum
在内容中使用单词和短语的最佳方式是什么?
内容中的单词变成实体对。
Web 内容中的单词应该以与人们说话的方式相同的方式流动,但它需要在 BERT 所寻找的术语中在语义上是正确的。 这将帮助您在 SERP 中获得最全面的结果。
寻找与您的头部搜索短语最相关的单个实体。 检查如何正确使用实体为读者添加上下文价值。 目前谷歌拥有最好的数据集来帮助算法学习。
以前缺乏商业头脑的 SEO 现在被迫了解商业策略并拥有全面的数字营销技能。 您的内容和通信中使用的单词或搜索短语很重要。 每一句话都应该是有用的和重要的。
自然语言处理模型的重要性
为什么要使用 NLP API 处理器来改进实体查询匹配?
转向更自然的语言方法的好处基本上有两个。
- 它使您的内容更易于人们阅读和采取行动。
- 它使搜索引擎更容易理解和编目您的内容。
回到在非结构化数据专利中使用实体引用回答问题。 它告诉我们,实体基本上就是人们在 Google 上搜索的内容。 拥抱 NLP 对于电子商务网站来说意义重大。 实施和测试您的产品标记,以帮助以预定义的方式组织您的登录页面。
考虑上述专利所述:
考虑上述专利所述:
“基于各自的加权和对一个或多个实体引用进行排名:至少部分基于一个或多个实体引用的排名,从一个或多个实体中选择一个实体结果到引用; 并至少部分基于实体结果为查询提供答案。”
Google 助理如何使用自然语言处理
另一项谷歌专利更侧重于处理移动会话搜索查询。
谷歌助手是一个人工智能驱动的虚拟助手,可以与搜索者进行个性化对话。 在正确响应会话搜索查询方面,它的表现优于其他所有。 它部分依赖于先前搜索会话的上下文。
2019 年 11 月 19 日授予的一项更新的 Google 专利更直接地与 Google Assistant 有关。 它的标题是基于上下文的自然语言处理,并向我们介绍了涉及用户请求的多模态处理的自然语言处理 (NLP) 方法。 与他们正在使用 BERT 更有效地理解自然语言的公告相吻合。
当面临“单独或孤立地处理都无法合理理解”的查询请求时,这家技术巨头正在寻求克服挑战。 Pandu Nayak Google 研究员兼搜索副总裁于 2019 年 10 月 25 日发表了一篇题为“比以往更好地理解搜索”的文章。 他说,“我们每天都会看到数十亿次搜索,其中 15% 的查询是我们以前从未见过的——因此我们已经建立了一些方法来为我们无法预料的查询返回结果”。
使用 BERT 算法,即使是小词现在也可以帮助更好地理解搜索意图。
“‘to’这个词及其与查询中其他词的关系对于理解其含义特别重要。 这是关于一个巴西人去美国旅行的故事,而不是相反。 以前,我们的算法无法理解这种联系的重要性,并且我们返回了有关美国公民前往巴西的结果。 借助 BERT,Search 能够掌握这种细微差别,并知道非常常见的单词“to”在这里实际上很重要,我们可以为这个查询提供更相关的结果。” - 谷歌
BERT 提供对单词和语言的更好理解
“语言理解是我们在搜索方面所做的一切的关键,”Pandu Nayak 说。 “这是我们在过去五年中发生的唯一、最大、最积极的变化。”
Google 可以通过识别与用户搜索相关的语音类型、实体节点或环境上下文来更好地解读用户请求。 您可以使用这些实体见解来展示您的行业利基专业知识。 该专利引用了“对话系统”和移动应用程序。
“传统的对话系统广泛用于信息技术行业,尤其是以无线电话和平板电脑的移动应用程序的形式。 通常,对话系统是指基于计算机的代理,它具有以人为中心的界面,用于访问、处理、管理和传递信息。 对话系统也称为聊天信息系统、口语对话系统、对话代理、聊天机器人、聊天机器人、聊天机器人、聊天代理、数字个人助理、自动在线助理等。” – 专利 US20160259775A1
现在这是属于“对话系统”的通信实体的综合列表! 该专利解释了 Google Assistant 是如何设计为通过 NLP 与搜索者联系的。
“对话系统以自然语言与其用户交互,以模拟智能对话并为用户提供个性化帮助。 例如,用户可能会以会话问题的形式向对话系统生成请求,例如“最近的酒店在哪里?” 或“亚历山大的天气怎么样?”,并以音频和/或可显示消息的形式从对话系统接收相应的答案。 用户还可以向对话系统提供语音命令…… – 专利 US20160259775A1

既然我们已经基本掌握了 Google 搜索如何使用 NLP,那么这将如何影响我们的内容创建和 SEO 方法是令人着迷的。
提高网站自然语言处理能力的 7 种 SEO 策略
NLP 有多种方式用于提高 SEO 和用户参与度。
1.确保您的网站和内容与主题相关
2.关注语义内容
3. 在内容连接中使用本体分类和相关性
4. 使用 Google AutoML 使企业能够查找实体
5.更新滞后或过时的旧帖子
6. 为依赖语音激活搜索的搜索者做计划
7.愿意尝试结构化数据
现在更深入地了解 Hill Web Marketing 将自然语言处理与语义网络技术和机器学习结合使用的方式。 通过这种方式,我们为电子商务销售获得了真正的 SEO 优势。
1.确保您的网站和内容与主题相关
奇怪的是,许多网站在没有明确关注特定主题的情况下胡言乱语。 如果您想销售“医疗器械创新”,请确保您的网站与“医疗器械”主题以及所有相关且有用的内容相关。
高分网页不仅仅是提供销售副本或直接回答问题。 它们还包含支持信息。 很多时候,一个答案会引发读者的另一个问题。 提供相关答案并预测他们的需求。 包括您知道他们将需要的信息 - 并且以前没有想到过。
谷歌希望在网络上提供解决方案; 即易于读者理解的“正确且相关的解决方案”。 结合结构化数据标记的结构化内容创建方法将大有帮助。
如果您在内容中提供这些需求答案和解决方案,您可以期待您的域的权威增长。 它还增加了您获得 Google Rich Card 的机会。
2.关注语义内容
语义知识映射以类别显示彼此相关的单词。
当前的谷歌算法更多地依赖上下文语言而不是逐字关键字。 自最近的算法更新以来,它专注于搜索者查询的整个上下文。 通过成为正确问题的最佳答案,您的企业将提供最大的价值。 您可以在此处添加常见问题架构,这是架构标记的基本类型。
检查您的内容长度以匹配您的搜索者的意图。 深入的信息内容可以满足一种需求,而快速的答案可以满足另一种需求。
通过对您的自然语言内容和内容结构进行语义分析,您可以找到内容中能够捕捉文本真正含义的所有单词。 现在,您可以进一步确定将哪些文本元素分配给它们的逻辑和语法角色。 通过这种方式,您可以在文本中与 BERT 一致的不同概念之间建立关系。
2019 年 8 月 8 日的基于 BERT 的语义知识匹配用于调度故障处置信息一文揭示了 BERT 模型的庞大性。 Jixiang Lu 和 Tao Zhang 表示“Bert 是基于海量 Wikipedia 数据(25 亿字)和 BookCorpus 数据(8 亿字)的预训练模型”。
它能够获得上下文单词表示。 举个例子,考虑一下谷歌地图上的所有内容。 它使用可能具有与其关联的多个属性的真实世界实体。
3. 在内容连接中使用本体分类和相关性
获奖内容也非常简洁,由权威来源撰写的更多事实性内容。 它也很吸引人。 当人们能够迅速在情感上与您的信息产生联系时,他们就会更可爱。 专注于解决更深层次的人类问题。 SEO 可以采用人工智能来改善用户体验并提供措辞清晰的解决方案。 B2B 内容还需要引人注目的转换触发器和智能 UX 设计。
谷歌投资于建立一个基于知识的概念库。 这有助于这家技术巨头更好地了解不同的企业或实体“知名”等事物,或定义实体之间更好的联系关系。 当用户参与历史表明搜索意图可能在查询中包括该实体时,特定实体的网页可能会在搜索结果中获得最高位置。
您的搜索策略可能需要同时包含自然搜索和付费广告,以吸引数字购物者。
4. 使用 Google AutoML 使企业能够查找实体
我们自己检查一下。 谷歌告诉我们 AutoML 自然语言是如何工作的。
1. 上传您的文件。 根据您的域特定关键字和短语标记文本。
2. 训练您的自定义模型。 分类、提取和检测情绪。
3. 评估。 获取与您的特定需求相关的见解。
Google 的 Natural Language API 可识别文本中的语法、实体和情感,并将文本组织成一组预定义的类别。 用于新闻文章、学术内容或揭示示例情感的内容可能会发现自然语言 API 值得尝试。 此外,我们喜欢通过使用自定义分类器来使用我们自己的标签。
5.更新滞后或过时的旧帖子
很少有读者消费过的现有“传统 SEO 文案写作”墙需要瓦解。 知识图谱、实体和自然语言都是至关重要的。 它们在常青内容中占有重要地位,同时承认人们如何从书面文本转向视觉媒体和视频内容的快速满足。
纯粹的技术作家可能缺乏主题知识或对他们的写作内容充满热情。 这使得用人们容易理解的最佳语气和词组选择变得更加困难。 了解哪些搜索可以通知您编写更好的内容。
然后,您将需要深入的技术 SEO 审核,以确保没有阻碍您的内容的故障。
最好的 SEO 内容策略从简单开始:
- 了解你的技能和激情。
- 知道你的听众想要什么。
- 您使用的实体应该建立您的品牌信任因素。
这是用于从输出中提取实体的脚本。
6. 为依赖语音激活搜索的搜索者做计划
许多技术可以为 Google 助理提供支持。 我们可以从谷歌那里得到关于它使用 BERT 来匹配问题答案的线索。 使用 NLP 支持基于语音模式和环境上下文的更好的上下文搜索。
语音激活搜索是人们发现和购买商品的一种自然方式。 这意味着营销人员应该调整他们的内容策略和 SEO 工作,以最好地与 Google 搜索的发展方式保持一致。 如果搜索者的思维方式和搜索偏好依赖语音助手应用程序,这会将他们的搜索行为从文本输入更改为语音输入。
根据张涛的说法,在微调期间,BERT 的“每个句子的最大序列长度设置为 128,每个序列的最大预测长度设置为 20”。 所以我们可以看到它在哪里更好地管理更长的搜索短语。 这适合语音激活的搜索查询,因为它们往往更长,如自然句子。
语音搜索将会增长,特别是对于希望免提、移动方便的广大移动用户而言。 他们快速思考并期待高效的用户体验。 预见到这种爆炸性的移动搜索趋势,BERT 处理复杂的自然语言查询比迄今为止任何东西都要好。
7.愿意尝试结构化数据
虽然Speakable
标记仍处于测试阶段,但您可以尝试。 如果识别出似乎通常是语音激活的Speakable
Schema 标记的重要问题,则可以听到回答。 与其他 SEO 策略一样,没有任何保证。 熟练的搜索营销人员将通过尝试、测试和调整工作获得自己的经验。 他们可以进行全面的网站审核,以找到改进搜索策略的方法。
谷歌算法更新会影响 SEO 最佳实践,因此最好灵活并快速学习。
尽可能多地使用适合您的上下文的结构化数据标记。 有多种 SEO 工具可用于提取实体。 这些实体及其唯一标识符可用于帮助向搜索引擎描述您的内容。
搜索引擎试图了解出现在您的页面上的实体、它们与其他实体的关系、它们与这些实体的属性(属性)的关联关系以及与这些实体的分类的关系。 您网站的架构、本体和结构化数据都有帮助。
查询中的命名实体识别 Google 专利号 US9009134B2
它的应用状态截至今天(2020 年 2 月 11 日)是有效的。它进一步解释了计算机科学和情感分析中的词性标注。
什么是查询分割?
该专利回答并定义了查询分割是什么。 知道它通常是指将特定查询分割成更小的单元。 它告诉我们“通常可能存在对可能的分段单元类型的限制,导致该方法的功能有限。 句法分析通常侧重于识别查询的语言结构。 查询分类通常分为两组:根据搜索意图进行分类,例如信息性、导航性或事务性; 并根据查询的语义进行分类。”
这可以应用于“采购”或“买家”。 两种形式的查询分类都考虑了整个查询。 一旦分类,通常不会对查询的内部结构进行进一步诊断。
我们还详细了解了它如何在采用无监督学习方法时克服模棱两可的主题实体和挑战。
“由于模型中的主题可以预先定义,并且可以给出文档的可能主题,因此可以采用一种新的学习主题模型的方法,称为弱监督潜在狄利克雷分配 (WS-LDA)。
对于每个单词
一种。 绘制主题分配 zn~Multinomial(θ)
湾。 画出单词 wn~Multinomial(βZn),一个以主题 zn 为条件的多项式分布。””
我们了解到,匹配实体的一个数据源可能是“查询日志数据,例如来自商业网络搜索引擎的查询日志”或类似的东西。 该专利提供了实施各种实施例以对来自计算机可读介质的实体进行分类的示例形式。 它提供的部分包括:“RAM、ROM、EEPROM、闪存或其他存储技术、CD-ROM、数字多功能磁盘 (DVD) 或其他光存储、磁带、磁带、磁盘存储或其他磁性存储设备,或任何其他可用于存储所需信息的介质”。
实体提取的机器翻译帮助可以在网络上的开源中找到。 跳入自定义实体建模令人兴奋——尤其是因为实体理解有助于我们与真实消费者更好地沟通。 本地业务模式是构建知识图谱和与本地消费者建立联系的基础。 辛迪克鲁姆说得最好,所以,我会再次引用她的话。
“总体而言,实体让谷歌对主题有更好、更深入的理解,因为它们让谷歌能够轻松地在不同主题(实体)之间建立联系和关系。 反过来,对实体及其关系的更深入了解使 Google 有机会以任何语言提供有关实体的信息(如有必要,可以从 Google 语言 API 进行实时翻译),因为现在该语言仅对查询——就像一个修饰符。 无论 Google 在一种语言中学习到的任何实体理解和实体关系都可以自动翻译成其他语言,尤其是在 Google 托管的零位置结果中,例如知识图。”
Google BERT 算法会尝试在您发布的页面与其识别的主题之间找到正确的联系。 您可以帮助 Google 在您的网站上找到正确的“实体”。
结论:
数据可以作为新的基准。 真正的常识 NLP 技术融合了新技术,如结构化知识模型。
人与人之间的对话可以很容易地理解所提出的问题,以便选择正确的答案来回应。 身体姿势、手势、语气都清楚地表明了谈话的真正内容。 NLP 正在帮助机器更好地做同样的事情。 随着我学习和实验的更多,我将更新这篇文章以使其更有用。 欢迎您使用 NLP 并发表评论。
寻找新方法来丰富您的内容。