如何解决网站上重复内容的问题

已发表: 2019-06-11

重复的内容是一个主要的 SEO 问题。 那里有狡猾的链接和避免谷歌的惩罚。 拥有重复的内容可能会损害任何网站的自然流量。 每个参与 SEO 的人都明白这一点。 这并不意味着重复的内容很容易避免。 尽管您尽了最大努力,您的网站仍可能会遇到重复内容的问题。

本指南旨在帮助您解决这些问题。 我们将向您指出可能出现重复内容的主要方式。 然后,我们将详细介绍您可以采取哪些措施来避免和解决重复内容问题。 不过,首先有必要解释一下什么是重复内容及其重要性。

预约咨询

重复内容和谷歌

解释什么是重复内容的最好方法是查看 Google 自己如何定义它。 在他们关于重复内容的支持指南中,他们提供了以下定义:

“域内或跨域的实质性内容块,它们要么完全匹配其他内容,要么明显相似。”

这很简单,这就是重复内容很重要的原因。 这是因为它如何影响谷歌旨在为用户提供的服务。 搜索引擎努力索引和显示具有不同信息的页面。 这是他们持续希望确保更好的用户体验的一部分。

具有重复内容的页面不符合具有不同信息的条件。 因此,谷歌将过滤那些重复的页面。 这意味着只会列出具有重复内容的页面之一。 这会对域的自然流量产生深远的负面影响。 根本不会列出本来可以为站点带来更多流量的页面。

谷歌对重复内容进行处罚是一种常见的误解。 事实并非如此,但如果他们怀疑恶意使用重复内容,他们就会采取行动。 那就是当内容被用来操纵他们的排名时。 在那种情况下,他们:

'对所涉及站点的索引和排名进行适当调整。 因此,该网站的排名可能会受到影响,或者该网站可能会从 Google 索引中完全删除。 在这种情况下,它将不再出现在搜索结果中。

到现在为止,您应该很明显希望避免网站上出现重复的内容。 即使您很小心地这样做,它仍然会发生。 发生这种情况的方式有很多种。

重复内容是如何产生的

正如我们已经提到的,重复的内容可以有意地出现在域中。 通常作为试图欺骗或操纵谷歌排名的一种方式。 每个 SEO 专业人士现在都知道 Google 的算法有多么聪明。 只有他们中最愚蠢或最漠不关心的人才会认为他们可以摆脱这种操纵。

网站上的重复内容自然形成的情况要常见得多。 这要么是由于某些技术问题,要么是简单的人为错误。 了解发生这种情况的主要方式很重要。 它将帮助您确定自己的重复内容问题。 它还将使选择最佳解决方案变得更加容易。

我们要讨论的重复内容的原因如下:

  • 用于过滤和跟踪的 URL 参数
  • 产品类别页面交叉
  • 重复的产品描述
  • URL 的技术问题
  • 打印机友好页面
  • 内容创作问题

用于过滤和跟踪的 URL 参数

URL 参数就像添加到页面 URL 末尾的后缀。 它们在许多情况下都会出现,并且通常不会对页面的内容产生很大的改变,甚至根本不会改变。 问题在于,对于搜索引擎而言,末尾具有不同参数的 URL 是不同的 URL。 如果“两个”URL 链接到的内容相同,Google 会将其识别为重复内容。

一个典型的例子是在电子商务网站上过滤产品。 几乎所有这些类型的网站都允许客户过滤产品。 他们可能希望只展示特定价格范围内或由特定材料制成的产品。 过滤产品的行为会向 URL 添加 URL 参数。 然而,显示的内容——产品等——将在其他地方复制。

另一个例子是跟踪的情况。 跟踪参数可让您跟踪网站访问者的来源。 这对于监控不同 SEO 工作的投资回报率至关重要。 它们可能看起来像这样:'/?source=rss'。 它们对页面内容没有影响,但在搜索引擎中也像一个唯一的 URL。

产品类别页面交叉

电子商务网站特有的另一个问题是类别页面交叉。 许多网站会有不同的类别页面,主要显示相同的产品。 这样做通常是出于善意和可以理解的原因。

例如,礼品网站可能有名为“给他的礼物”和“父亲节礼物”的类别。 这两个类别可能会吸引不同的客户。 不过,类别页面上显示的产品几乎相同。 这对谷歌来说很重要,他们很可能只会索引其中一个页面。

复制产品说明

在电子商务网站上,类别页面的下一级是产品页面。 这些也可能是重复内容问题的常见来源。 此类页面的访问者会期望有简短的产品说明。 这将是产品的功能和特性如何销售给客户。

销售大量产品的网站通常不会为每一种产品创建独特的描述。 许多公司只是简单地复制和粘贴通用信息。 通常由供应商或制造商提供。 这会导致不同域内和跨域的大量重复内容。

在这种情况下,最大的问题是您的网站是否销售与亚马逊等更大的零售商相同的产品。 复制的描述可能会导致您的产品页面出现在亚马逊上找到的重复内容。 谷歌肯定会索引亚马逊的页面而不是你的。

URL 的技术问题

除了 URL 参数之外,还有一些其他技术性 URL 问题可能会导致重复内容问题。 第一个以“会话 ID”的形式出现。 当网站访问者被赋予“会话”时,这些在 URL 中使用。 这通常是为了让他们可以将商品添加到购物车并让它们留在那儿。

当访问者访问您的网站时,会话 ID 会添加到每个内部链接中。 这会创建大量 URL,搜索引擎可能会将其视为重复内容。 同样,不整洁的 URL 作为 CMS 的一部分可以产生类似的效果。 带有更改顺序的类别和文章参数的 URL 是主要示例。

打印机友好页面

您的 CMS 可能会创建适合打印的页面。 这些页面将从文章页面和其他地方链接到您的网站。 谷歌将能够找到这些页面,除非您特别阻止它们(稍后会详细介绍)。

Google 将仅过滤和索引其中一个重复页面。 那可能是原始版本或打印机友好版本。 您希望您的原始页面排名,而不是打印机友好的页面。 后者不会拥有您所有的广告、链接和其他内容。

内容创建问题

以上大部分是重复内容问题的技术原因。 人为错误出现在内容创建领域。 现在几乎每个站点都有博客或类似的信息资源。 它可以帮助他们向访问者提供有用的信息。 博客通常包含大量重复内容。

这可能是因为将内容创作托付给了您不该托付的人。 不了解重复内容可能导致的问题的人。 他们可能会在不知道自己造成的 SEO 问题的情况下复制或重新创建内容。 他们的错误可能与总是使用相同的标题标签一样小。 它们可能大到直接从其他站点复制内容。

解决重复内容的问题

您现在应该知道您的重复内容问题可能来自何处。 以上是许多站点常见的那些问题的所有原因。 了解它们并了解哪些影响了您的网站至关重要。 这是因为不同的原因适用于不同的解决方案。

我们将介绍一些解决重复内容问题的最佳方法。 我们将标记我们已经提到的哪些问题和原因最适合我们的每个解决方案。 我们的解决方案分为两类:

  • 教育和预防解决方案
  • 实用的解决方案和恢复工作

教育和预防解决方案

在理想情况下,您希望在重复内容出现之前避免这些问题。 了解我们所讨论的问题的原因是一个很好的起点。 了解这些知识可以帮助您采取措施确保没有新内容会遇到同样的问题。

例如,您可以在系统设置中禁用会话 ID。 这将防止可能导致的重复 URL 问题。 您可以选择完全放弃在您的网站上包含打印机友好页面。 无论如何,现在并不是很多人都有理由打印页面。 基于标签的跟踪活动也可以很好地替代基于参数的跟踪。

了解重复内容的原因后,您就可以教育其他人了。 他们可以包括网络开发人员或您的产品团队。 您可以向他们解释与产品类别交叉相关的问题。 这样他们就会知道相应地安排产品。 还可以向自由职业者或内部内容创作者介绍如何保持事物的独特性。

那是在一个理想的世界里。 实际上,您可能无法解决所有重复内容问题。 在这些情况下,您需要一些实用的解决方案。 它们将帮助您从已经遭受的问题中恢复过来。

实用的解决方案和恢复工作

到目前为止,我们的指南应该已经向您展示了重复内容问题可能来自何处。 我们现在还提供了一些技巧来避免出现更多问题。 如果您的网站已经出现重复内容问题,剩下的就是建议一些行动方案。 有很多不同的选择供您选择。

规范网址

如果您的问题是指向相同内容的不同 URL,规范 URL 会有所帮助。 如前所述,在过滤参数或类别页面的情况下。 规范 URL 是“正确”的 URL。 它是您希望 Google 从指向相同内容的页面中索引出的页面的 URL。 您需要在每种情况下决定是哪个页面。

识别后,很容易告诉 Google 哪个页面是您的规范 URL。 您需要做的就是将 HTML 元素添加到其他页面的 <head> 部分。 称为“规范链接元素”,它看起来像这样; 'rel=规范'。 当其后跟其 URL 时,它会将 Google 指向您选择的页面。

301重定向

将 Google 指向规范 URL 有时被描述为使用“软重定向”。 这与完全成熟的 301 重定向相反。 如果您不能或不想删除重复内容,也可以使用这些。

将 301 重定向应用于 URL 会将 Google 引导至您选择的页面。 然后它将是搜索引擎索引的页面。 这可能是解决产品类别页面重叠问题的有用解决方案。

您需要做的就是从网络流量的角度确定哪些类别对您最有价值。 然后,您可以使用 301 重定向从其他重复或重叠的页面到该类别。

无索引标签

Noindex 标记是可以添加到页面的 HTML 源代码中的指令。 它明确告诉谷歌您不希望该页面被编入索引。 这可以防止 Google 过滤掉您确实希望编入索引的页面以支持您不希望编入索引的页面。

Noindex 标签是解决由打印机友好页面引起的问题的最佳解决方案。 您应该将 Noindex 标记应用于每个页面。 这将确保每个页面的原始版本都是谷歌索引的版本。

重写内容

有时重复的内容问题无法快速解决。 如果您的问题出在博客文章或产品描述上,就是这种情况。 如果他们创建了重复的内容,您需要找到有问题的副本并重写它。 这种解决方案既费时又费力。 没有其他方法可以巧妙地处理这个问题。

一种可以节省时间和精力的方法是使用免费的在线工具,例如 Copyscape。 Copyscape 旨在帮助您编写未被剽窃的内容。 您可以在站点中弹出一个 URL,它会在网络上搜索重复的内容。 这使您可以找到您需要剪切、替换或重写的确切内容元素。