重复内容和搜索引擎优化:谷歌检查什么?
已发表: 2022-05-10重复的内容和搜索引擎优化是一个糟糕的组合。
如果您不想运行完全是世界末日的 SEO 活动,那么您绝对需要避免重复的内容。
相反,专注于为读者和搜索引擎创建独特的、有价值的和优化的内容。
为了帮助您避免发布重复内容的破坏性影响,我们将深入探讨重复内容是什么、它如何影响 SEO 以及您可以采取哪些措施来避免它。

什么是 SEO 中的重复内容?
您对重复内容了解得越多,就越容易避免重复内容。
根据谷歌的说法,重复内容被定义为与其他地方的内容完全或部分匹配的“实质性内容块”。
重复的内容可能会在同一网站内被检测到或跨多个域发布。 任何发布内容的网站都可能存在重复内容问题。
无论网站所有者有内部作者还是与第 3 方内容贡献者合作,在很多情况下,网站都会无意中生成重复的内容:
- 产品和类别页面:一些电子商务网站对产品和类别页面使用类似的模板。 这些模板可能包含大量相同的信息,例如类别描述和结帐说明。
- 登台站点:尽管很少见,但无论出于何种原因缺少“noindex”标签的登台站点都可以被视为重复内容。 暂存站点是网站的实验性副本,用于在上线前预览和测试新功能和更改。
- 带有“打印机”版本的页面:一些网站为可能希望离线进行研究的用户创建“打印机友好”版本的页面。 虽然这些版本被视为重复内容,但它们通常不会对 SEO 产生任何负面影响。
- 通用网站模板:从未见过大量定制的新网站可能会使用包含预先生成的文本的内容管理系统模板。 一些例子是 WordPress 驱动的网站,这些网站使用带有默认内容的主题作为千篇一律的页面,如联系页面、“关于”页面等。
- 指向同一页面的多个 URL:Google 可能会检测到可通过多个 URL 访问的内容的重复页面。 例如,可以使用带有 HTTP 或 HTTPS 的 URL 以及带有或不带有“www”的 URL 访问登录页面。
这些是无意中创建重复内容的众多示例中的一部分。 对获得重复内容的容易程度感到惊讶吗? 好消息是,并非所有人都是坏事。
Google 是否会实施重复内容处罚?
简短的回答是肯定的——谷歌会调整那些被发现有重复内容的网站的排名和索引。 但是,只有在故意复制内容以操纵排名或误导用户时才会发生这种情况。
某些类型的重复内容并不是为了操纵搜索排名而制作的,例如临时站点和产品描述副本。
谷歌已经知道这一点,这就是为什么他们不会自动对每个拥有重复内容的网站进行处罚。
为什么 Google 会关心重复内容?
首先,重复的内容可以防止原始帖子/内容获得应有的排名。 而且,在某些情况下,用户可能会发现相同的内容多次出现在搜索结果中。
这会损害用户体验,并且对整个搜索引擎不利。
此外,不检查重复内容可能会导致欺诈或模仿网站激增,这些网站通过重新上传现有内容而蓬勃发展。
请记住,用户可能会认为复制了多个权威帖子的网站是值得信赖的。 这实质上使恶意行为者能够利用源源不断的在线内容从阴暗的做法中获利——而无需投资于内容创作本身。
哪些类型的重复内容可能会导致 Google 处罚?
担心重复内容处罚的可能性?
从统计上讲,大多数网站所有者不必考虑它。
重复的内容非常普遍。 实际上,一个众所周知的事实是,大约 25-30% 的网络是重复内容。
但是,由于 Google 的处罚可以单枪匹马地扼杀在线业务,因此永远不会太安全。 使用 Google Search Console 了解您是否受到处罚,并按照相应步骤减轻处罚。
以下是可能对 SEO 产生负面影响的重复内容类型:
1. 内容作者制作的重复内容
并非所有作家都是平等的。
有些人从其他网站复制和粘贴内容(咳——抄袭——咳——太危险了——咳)。
虽然还有其他人努力进行广泛的研究并巧妙地写作,以确保他们只产生史诗般的内容。
这就是为什么您需要与经过审查的自由作家或团队合作。
通过这样做,您可以与不会从其他来源复制和粘贴内容的敬业的专业作家合作。
更重要的是,这些类型的作家知道如何写出吸引人的标题,将转化诱导元素整合到他们的文章中,并为内容营销活动带来有意义的结果。
另一方面,由于作者复制和粘贴内容而最终发布重复内容的公司面临着巨大的风险。
除了潜在的 Google 处罚外,他们还可能面临诉讼,这可能会损害他们的声誉而无法修复。
重视您的招聘流程。 仔细审查您的作家,或选择一家在制作独特、有价值的内容方面有着良好记录的机构。 点击推文2. 配置错误的联合内容
首先,值得一提的是,内容联合是一种合法的营销策略,即使是专业营销人员也会使用。
内容联合是将现有帖子重新发布到另一个网站或平台的过程。 内容联合网站的一些示例包括:
- 中等的
- 领英
- 幻灯片共享
- 知乎
网站所有者故意使用内容联合来通过其内容覆盖更广泛的受众。 虽然它在技术上符合不同域上的重复内容,但通常不是问题。
除非联合您的内容的网站没有包含正确的反向链接。
如果没有链接,搜索引擎将不知道哪个版本是原始版本。 因此,如果 Google 没有首先对您进行处罚,那么联合内容最终可能会超过您的网站。
3. 抄袭内容
随着网站越来越受欢迎,由于内容抓取工具,它可能会处理越来越多的重复内容。
简单来说,内容抓取工具是指旨在从网站批量下载内容的软件——无论是否获得所有者的许可。 它与其他仅用于提取特定数据(如关键字和各种指标)的网络抓取工具有很大不同。
黑帽营销人员使用抓取工具窃取内容用于各种目的,例如垃圾邮件和直接内容盗窃。 无论出于何种目的,非法内容抓取都可能导致原始来源出现重复内容问题。
如何避免重复内容?
谷歌对重复内容进行处罚的可能性可能很小,但它们是巨大的。
如果 Google 检测到恶意意图,重复内容可能会导致网站排名下降。 在少数情况下,网站会完全被列入黑名单,不会出现在搜索引擎结果中。

幸运的是,有几种行之有效的方法可以避免重复内容的问题:
1. 小心辛迪加
如果内容联合是您的内容营销策略的重要组成部分,请格外小心。
确保联合内容包含指向原始内容的带有“规范”标签的链接(也称为规范 URL)。
受信任的内容联合网站默认执行此操作。 但为了更好的衡量标准,请联系并验证您的每篇文章上是否都有规范标签。
专业提示:使用 Ahrefs 等重复内容工具在您的网站内部或不同网站上查找重复内容。
2. 在档案和分类页面上使用“noindex”标签
如果 Google 在您的内容上对存档或类别页面进行排名,您可以使用 noindex 标签阻止对这些页面的索引。
您所要做的就是将一个简单的元标记粘贴到您的页面或帖子的“<head>”部分。
要阻止所有搜索引擎爬虫将页面编入索引,请使用:
- <元名称=“机器人”内容=“noindex”>
如果您只想阻止 Google 将特定页面编入索引,请使用:
- <元名称=”googlebot” 内容=”noindex”>
(图片来源:Developers.Google.com)
3.检查不良重复内容
有许多工具可以自动扫描您的网站以查找不良重复内容。 Ahrefs 就是一个很好的例子,它可以通过站点审核工具检查网站是否存在不良重复。
(图片来源:Ahrefs.com)
您还可以使用 SEO Review Tools 的 Duplicate Content Checker 来扫描您网站上的内部和外部重复项。
(图片来源:SEOReviewTools.com)
内部重复内容是指您网站内的重复内容。 另一方面,外部重复是指不同站点上的重复内容。
使用工具可以轻松发现可能损害您网站的 SEO 配置文件的无意重复内容。
如果您发现重复的内容,您可以采取以下措施来修复它们:
- 使用规范标签指定原始内容
- 在重复项上使用“noindex”标签
- 删除重复的内容
4.使用抄袭检查器
对于从承包商那里获取内容的品牌,像 Copyscape 这样的工具可以保证您发布 100% 的原创内容。
Copyscape 是一个久经考验的抄袭检查器,可以立即检查文章是否包含重复信息。 它是每个内容营销机构工具箱中的必备工具。
(图片来源:Copyscape.com)
除了按需抄袭检查外,Copyscape 还具有“Copysentry”功能。 每月只需 4.95 美元,该工具将每周在网上检查多达 10 页的副本。
每当有人窃取您的内容并将其发布到其他地方时,Copyscape 都会发送电子邮件提醒您采取行动。 您可以通过 Google 的法律帮助部分请求删除重复的内容、请求规范链接或提交 DMCA 删除。
5.合并相似页面
有时,讨论同一主题的页面包含可能被视为重复的相似信息。
例如,您可能有一个包含重叠项目的清单,这些项目具有几乎相同的产品描述。 您可能还有针对不同城市的类似登录页面,其中可能包含大量重复文本。
在这两种情况下,一个简单的解决方法是将信息整合到一个帖子中。
网站所有者还应避免使用通用页面模板,除非他们计划执行大量自定义。 这最大限度地减少了无意中创建可能混淆读者和搜索引擎爬虫的重复内容的机会。
6.与内部链接保持一致
在构建指向特定页面的内部链接时,请确保每次都使用相同的 URL。
不要在一篇文章中链接到“http://yoursite.com/blog/your-post/”,在另一篇文章中链接到“https://www.yoursite.com/blog/your-post/”。 对多个内部链接使用单个 URL 表明您正在链接到规范页面。
经常问的问题
1. 谷歌如何看待重复内容?
Google 将重复内容定义为包含与现有内容相似或“明显相似”的信息的内容块。 用同义词改变几个词,甚至改写整个段落都不足以向谷歌隐藏重复的内容。
2. 可以复制产品描述吗?
重复的产品描述不会以任何方式影响 SEO。 只要您不误导读者,请随意在有意义的地方使用复制粘贴的产品描述。
3. 重复内容最常见的修复方法是什么?
使用 rel=canonical 标签修复了很多重复内容问题,从动态 URL 参数到内容联合。 这是一个通用的解决方案,告诉 Google 如何查找原始内容。
在主导您的行业时避免重复内容
使用上述提示,您可以避免发布重复内容并体验其破坏性影响。
如果您想要一种没有重复内容并且可以推动收入和业务增长的内容营销策略,请立即与我们联系。
我们的成功经理可以组建(和管理)一支由经验丰富的制作人、编辑和作家组成的团队,以满足您的所有内容需求。