重复内容和 SEO:完整指南

已发表: 2022-09-11

想象一下将您网站的内容放在另一个网站上! 如果您网站上的重复内容被错误地放置在那里,或者是否有人从您的网站窃取了内容块,这无关紧要。 您必须迅速采取行动纠正这种情况。

无论您是负责小型企业还是大型跨国公司,都无关紧要。 重复的内容对任何对 SEO 友好的网站都是一种危害。

让我们看看如何发现重复内容并确定它是在内部还是跨域影响您网站的性能。

什么是重复内容?

Duplicate Content
重复内容

与其他网站或同一网站的多个页面上的内容相似或完全相同的内容称为重复内容。 在您的网站上有大量重复内容可能会损害您的 Google 排名。

换一种方式:

重复内容是与另一页上的内容逐字相同的内容。 但是,“重复的东西”包括与其他内容相似的内容……即使稍微重写。

重复内容和搜索引擎优化之间有什么关系?

Google 不会对复制内容施加任何处罚。 但是,由于主要搜索引擎过滤相同的内容,您的访问者可能会被转移,从而导致处罚。 因此,网站的排名将受到影响。 重复的内容是谷歌混乱的根源,因为它迫使搜索引擎在相同的页面之间进行选择以进行排名。

谁创建了原始内容可能并不重要,因为原始内容可能不会被选择在 SERP 中进行排名。 重复内容是要避免的 SEO 错误之一的众多原因之一就是因为这个。

考虑聘请 SEO 专家来帮助您解决此问题。 重复的内容将不再是问题,SEO 服务将相当便宜。

哪些是重要的页面元素?

为避免重复内容问题,请确保您网站的每个页面在 HTML 代码中都有自己的元描述和页面标题。 h1、h2 和 h3 等标题必须与网站其他页面上的标题不同。

虽然元描述、标题和标题只占您网站内容的一小部分,但最好尽可能远离重复内容的灰色区域。 这是让搜索引擎查看您网站上元描述价值的好方法。

重复内容如何影响 SEO?

Google 不希望对具有重复内容的页面进行排名。

实际上,根据谷歌的说法:

“谷歌尽一切努力索引和显示具有独特信息的页面。”

因此,在您的网站上拥有没有不同信息的页面会损害您的搜索引擎结果。 以下是具有大量重复内容的网站面临的三个最常见的问题。

更少的自然流量:

这是不言自明的。 Google 不希望对使用从其索引中的其他页面复制的内容的页面进行排名。 (这可以包括您自己网站上的页面。)

假设您的网站上有三个页面,它们都具有可比较的内容。

Less Organic Traffic
自然流量减少

谷歌不确定这两个页面是否是“原始页面”。 结果,所有三个页面都将很难进行排名。

Duplicate pages will all struggle to rank
重复的页面都很难排名

处罚(极为罕见):

据谷歌称,重复的内容可能会导致网站被罚款或完全取消索引。

Penalty
惩罚

然而,这并不常见。 只有当网站故意从其他网站抓取或复制内容时才会这样做。

duplicate content penalty
重复内容惩罚

因此,如果您的网站有很多重复页面,您通常不必担心“重复内容惩罚”。

更少的索引页面:

这对于拥有大量页面的网站(如电子商务网站)尤为重要。

Fewer Indexed Pages
更少的索引页面

重复的内容并不总是被 Google 降级。 它根本不会索引它。

如果您网站上的页面未编入索引,则您的抓取预算可能会浪费在重复的内容上。

最佳实践

注意不同 URL 上的相同内容

这是重复内容问题的最典型原因。

假设您是电子商务商店的所有者。

您还在产品页面上提供 T 恤。

example product page
示例产品页面

如果一切都正确放置,那么该 T 恤将在同一 URL 提供各种尺寸和颜色。

Product with all variations
具有所有变化的产品

但是,您可能会发现您的网站会为您的产品的每个新版本生成一个新 URL……这会导致数千个具有重复内容的页面。

检查索引页面

检查您的网站在 Google 中编入索引的页面数量是发现重复内容的最简单方法之一。

您可以通过访问 Google 并输入 site:example.com 来执行此操作。

Check Indexed Pages
检查索引页面

或者,转到 Google Search Console 并查看您的索引页面。

确保您的网站正确重定向

您并不总是拥有同一页面的多个版本……有时您拥有同一站点的不同版本。

虽然不常见,但我在野外已经目睹了无数次。

当您网站的“WWW”版本未重定向到“非WWW”版本时,就会出现此问题。

如果您在切换到 HTTPS 后没有重定向 HTTP 站点,也会发生这种情况。

换句话说,您网站的所有多个版本都应该在同一个位置结束。

Make Sure Your Site Redirects Correctly
确保您的网站正确重定向

使用 301 重定向

解决您网站上重复内容问题的最简单方法是使用 301 重定向。 如果您在网站上发现大量重复的内容页面,只需将它们重定向到原始页面。 当 Googlebot 访问时,它会评估重定向并仅索引原始内容。

留意类似的内容

重复的内容并不总是意味着从另一个来源逐字复制的内容。

事实上,谷歌将重复内容定义为:即使您的内容在技术上与现有内容不同,您仍然可能遇到重复内容问题。

Google - duplicate content
谷歌——重复的内容

在大多数情况下,这不是问题。 大多数网站都有几十页。 他们还为每个页面编写独特的内容。 但是,在某些情况下可能会出现“相似”的重复内容。

为您网站的每个页面创建 100% 独特的内容是否耗时? 是的。 但是,如果您认真考虑对网站上的每个页面进行排名,那么它是必要的。

使用规范标签

Canonical-tag
规范标签

搜索引擎了解 rel=canonical 标签的含义:

“是的,我们网站上的许多页面都有重复的内容。 但是,这是原始页面。 其余的可以忽略。”

根据谷歌的说法,使用规范标签比阻止具有重复内容的页面更可取。

Use the Canonical Tag
使用规范标签

(例如,利用 robots.txt 或网页 HTML 中的 noindex 元素来阻止 Googlebot)

因此,如果您在网站上发现大量重复页面,您可以:

  • 从等式中删除它们。
  • 他们应该被重定向。
  • 应该使用规范标签。

使用工具

有一些 SEO 工具具有检测重复内容的功能。

定位器Opens in a new tab. ,例如,在您的网站上搜索包含大量重复内容的页面。

siteliner
定位器

合并页面

正如我之前所说,如果您有许多具有相同内容的网站,您可能应该将它们重定向到一个页面。

但是,如果您的页面内容相似怎么办? 但是,您可以为每个页面创建独特的内容……或者将它们组合成一个超级页面。

Noindex WordPress标签或类别页面

如果您使用 WordPress,您可能已经注意到标签和类别页面是自动生成的。 这些页面上的重复内容很多。

我建议在这些页面上添加“noindex”标签,以便它们对用户有用。 这样,它们就可以存在而不被搜索引擎索引。 您也可以配置 WordPress 以完全阻止这些页面的生成。

什么是抓取的内容?

当一个网站所有者从另一个网站所有者那里抓取内容以提高有机可见性时,就会发生抓取的内容。 这些网站管理员试图说服机器重写他们从其他网站获得的抓取内容。

抓取的内容有时很容易被发现,因为窃贼经常不会尝试更新内容中的品牌术语。 如果您被发现试图操纵 Google 搜索索引,您的网站的排名将大大降低,或者可能从搜索结果中完全删除。

最后的话

避免无意的重复也很重要,因为这可能会导致 Google 受到处罚,这会同时影响您的所有内容。

1) 确保每个词都是作者的,而不是简单地复制和粘贴文本或照片而不添加任何新内容以确保原创性。

2)适当地使用关键字来保持您的内容相关。

3) 尽可能使用同义词。

Google 的算法不断更新,以识别和惩罚垃圾网站。