Дублированный контент и SEO: что проверяет Google?
Опубликовано: 2022-05-10Дублированный контент и SEO — плохое сочетание.
Если вы не хотите проводить совершенно апокалиптические SEO-кампании, вам абсолютно необходимо избегать дублирования контента.
Вместо этого сосредоточьтесь на создании фрагментов контента, которые будут уникальными, полезными и оптимизированными для читателей и поисковых систем.
Чтобы помочь вам избежать разрушительных последствий публикации дублированного контента, мы подробно рассмотрим, что такое дублированный контент, как он влияет на SEO и что вы можете сделать, чтобы этого избежать.

Что такое дублированный контент в SEO?
Чем больше вы знаете о дублирующемся контенте, тем легче его избежать.
Согласно Google, дублированный контент определяется как «существенные блоки контента», которые точно или частично совпадают с контентом, найденным в другом месте.
Дублированный контент может быть обнаружен на одном веб-сайте или опубликован в разных доменах. Любой веб-сайт, который публикует контент, может иметь проблемы с дублированием контента.
Независимо от того, есть ли у владельцев сайта собственные авторы или они работают со сторонними авторами контента, во многих ситуациях веб-сайты непреднамеренно генерируют дублированный контент:
- Страницы продуктов и категорий. Некоторые веб-сайты электронной коммерции используют аналогичные шаблоны для страниц продуктов и категорий. Эти шаблоны могут содержать фрагменты одной и той же информации, например описания категорий и инструкции по оформлению заказа.
- Промежуточные сайты: хотя и редко, промежуточные сайты, на которых по какой-либо причине отсутствует тег «noindex», могут считаться дублирующим контентом. Промежуточные сайты — это экспериментальные копии веб-сайтов, используемые для предварительного просмотра и тестирования новых функций и изменений перед запуском.
- Страницы с версиями для печати. Некоторые веб-сайты создают версии страниц для печати для пользователей, которые могут захотеть провести исследование в автономном режиме. Хотя эти версии рассматриваются как дублированный контент, они обычно не оказывают негативного влияния на поисковую оптимизацию.
- Универсальные шаблоны веб-сайтов. Новые веб-сайты, которые никогда не подвергались серьезной настройке, могут использовать шаблоны для систем управления контентом, загруженные предварительно сгенерированным текстом. Некоторыми примерами являются веб-сайты на базе WordPress, которые используют темы с содержимым по умолчанию для шаблонных страниц, таких как страницы контактов, страницы «О нас» и так далее.
- Несколько URL-адресов, указывающих на одну и ту же страницу. Google может обнаруживать дубликаты страниц для контента, доступного по нескольким URL-адресам. Например, доступ к целевой странице можно получить, используя URL-адреса с HTTP или HTTPS, а также URL-адреса с «www» или без него.
Это лишь некоторые из многих примеров непреднамеренного создания дублированного контента. Удивлены тем, как легко получить дублированный контент? Хорошая новость в том, что не все из них плохие.
Применяет ли Google штраф за дублирование контента?
Короткий ответ — да: Google корректирует рейтинг и индексацию сайтов, признанных виновными в наличии дублирующегося контента. Однако это происходит ТОЛЬКО в том случае, если контент намеренно копируется для манипулирования рейтингом или введения пользователей в заблуждение.
Некоторые типы дублированного контента не создаются с целью манипулирования поисковым рейтингом, например, промежуточные сайты и копии описания продукта.
Google уже знает об этом, поэтому они не накладывают автоматически штрафы за дублированный контент на каждом веб-сайте, на котором они есть.
Почему Google заботится о дублирующемся контенте?
Во-первых, дублированный контент может помешать присвоению исходным сообщениям/контенту должного рейтинга. А в некоторых случаях пользователи могут обнаружить, что один и тот же контент несколько раз появляется в результатах поиска.
Это ставит под угрозу пользовательский опыт и вредит поисковой системе в целом.
Кроме того, если не проверять дублированный контент, это может привести к появлению мошеннических или подражательных веб-сайтов, которые процветают за счет повторной загрузки существующего контента.
Имейте в виду, что пользователи могут воспринимать веб-сайт, который скопировал несколько авторитетных сообщений, как заслуживающий доверия. По сути, это позволяет злоумышленникам пользоваться бесконечным количеством онлайн-контента для получения прибыли от теневых практик, не вкладывая средств в собственное создание контента.
Какие типы дублированного контента могут привести к штрафу Google?
Беспокоитесь о возможности штрафов за дублирование контента?
По статистике, большинству владельцев веб-сайтов не нужно об этом думать.
Дублированный контент встречается на удивление часто. На самом деле общеизвестно, что около 25-30% веб-страниц содержит дублированный контент.
Но поскольку штраф Google может в одиночку убить онлайн-бизнес, никто никогда не может быть в полной безопасности. Используйте консоль поиска Google, чтобы узнать, получили ли вы штраф, и следуйте инструкциям, чтобы смягчить его.
Вот типы дублированного контента, которые могут негативно повлиять на SEO:
1. Дублированный контент, созданный авторами контента
Не все писатели созданы равными.
Есть те, кто копирует и вставляет контент с других сайтов (кашель — плагиат — кашель — так опасно — кашель).
В то время как есть другие, которые стараются проводить обширные исследования и мастерски писать, чтобы гарантировать, что они не производят ничего, кроме эпического контента.
Вот почему вам нужно работать с проверенными внештатными писателями или командами.
Поступая таким образом, вы сотрудничаете с преданными своему делу профессиональными авторами, которые не будут копировать и вставлять контент из других источников.
Более того, это те авторы, которые знают, как писать броские заголовки, интегрировать элементы, стимулирующие конверсию, в свои рецензии и приносить значимые результаты в кампании контент-маркетинга.
С другой стороны, компании, которые в конечном итоге публикуют дублированный контент из-за того, что их авторы копируют и вставляют контент, сталкиваются с огромными рисками.
В дополнение к потенциальным штрафам Google, они могут столкнуться с судебными исками, которые могут нанести непоправимый ущерб их репутации.
Сделайте премию к процессу найма. Внимательно проверяйте своих авторов или выбирайте агентство, имеющее проверенный опыт создания уникального ценного контента. Нажмите, чтобы твитнуть2. Неправильно сконфигурированный синдицированный контент
Прежде всего, стоит упомянуть, что синдикация контента является законной маркетинговой стратегией, которую используют даже профессиональные маркетологи.
Синдикация контента — это процесс повторной публикации существующего сообщения на другом веб-сайте или платформе. Некоторые примеры веб-сайтов синдикации контента включают:
- Середина
- SlideShare
- Куора
Владельцы веб-сайтов намеренно используют синдикацию контента, чтобы охватить своим контентом более широкую аудиторию. Хотя технически это квалифицируется как дублированный контент на разных доменах, обычно это не вызывает беспокойства.
Если только сайт, который распространил ваш контент, не содержал правильную обратную ссылку.
Без ссылки поисковые системы не узнают, какая версия является оригинальной. В результате синдицированный контент может в конечном итоге оказаться выше вашего сайта, если Google сначала не накажет вас штрафом.
3. Вычищенный контент
По мере роста популярности веб-сайта он может столкнуться с увеличением количества дублированного контента из-за парсеров контента.

Проще говоря, парсеры контента — это программное обеспечение, предназначенное для массовой загрузки контента с веб-сайтов — с разрешения владельца или без такового. Он сильно отличается от других парсеров, которые предназначены только для извлечения определенных данных, таких как ключевые слова и различные показатели.
Черные маркетологи используют скребки для кражи контента для различных целей, таких как спам и прямая кража контента. Какой бы ни была эта цель, парсинг незаконного контента может привести к проблемам с дублированием контента для исходного источника.
Как избежать дублирования контента?
Шансы на штрафы Google за дублированный контент могут быть небольшими, но они существенны.
Дублированный контент может привести к снижению рейтинга веб-сайта, если Google обнаружит злонамеренные намерения. В некоторых случаях веб-сайт полностью попадает в черный список из результатов поиска.
К счастью, есть несколько проверенных способов избежать проблем с дублированием контента:
1. Соблюдайте осторожность
Если синдикация контента является важной частью вашей стратегии контент-маркетинга, делайте это с особой осторожностью.
Убедитесь, что синдицированный контент содержит ссылку с тегом «канонический» на исходный контент (также называемый каноническим URL-адресом).
Надежные веб-сайты синдикации контента делают это по умолчанию. Но на всякий случай протяните руку и убедитесь, что на каждой из ваших статей есть канонический тег.
Совет для профессионалов: используйте инструмент дублирования контента, такой как Ahrefs, чтобы найти дублированный контент внутри вашего сайта или на других сайтах.
2. Используйте тег «noindex» на страницах архивов и категорий.
Если Google ранжирует страницы архивов или категорий выше вашего контента, вы можете заблокировать индексацию этих страниц с помощью тега noindex.
Все, что вам нужно сделать, это вставить простой метатег в раздел «<head>» вашей страницы или публикации.
Чтобы запретить всем поисковым роботам индексировать страницу, используйте:
- <meta name="robots" content="noindex">
Если вы хотите запретить Google индексировать только определенную страницу, используйте:
- <meta name="googlebot" content="noindex">
(Источник изображения: Developers.Google.com)
3. Проверьте наличие плохого дублированного контента
Существуют десятки инструментов, которые могут автоматически сканировать ваш сайт на наличие плохого дублированного контента. Хорошим примером может служить Ahrefs, который может проверять веб-сайты на наличие плохих дубликатов с помощью инструмента Site Audit.
(Источник изображения: Ahrefs.com)
Вы также можете использовать Duplicate Content Checker от SEO Review Tools для сканирования внутренних и внешних дубликатов на вашем веб-сайте.
(Источник изображения: SEOReviewTools.com)
Внутренний дублированный контент относится к повторяющемуся контенту на вашем сайте. Внешние дубликаты, с другой стороны, относятся к дублирующемуся контенту на разных сайтах.
Использование инструментов позволяет легко обнаружить непреднамеренное дублирование контента, которое может нанести вред SEO-профилю вашего сайта.
Если вы обнаружите дублирующийся контент, вот что вы можете сделать, чтобы исправить его:
- Обозначьте исходный контент каноническим тегом
- Используйте тег «noindex» для дубликатов
- Удалить дублированный контент
4. Используйте средства проверки на плагиат
Для брендов, которые получают контент от подрядчиков, такой инструмент, как Copyscape, гарантирует, что вы публикуете 100% оригинальный контент.
Copyscape — это проверенная временем программа проверки на плагиат, которая может мгновенно проверить, содержит ли статья дублирующуюся информацию. Это должно быть в наборе инструментов каждого контент-маркетингового агентства.
(Источник изображения: Copyscape.com)
Помимо проверки на плагиат по запросу, Copyscape также имеет функцию «Copysentry». Всего за 4,95 доллара в месяц инструмент будет еженедельно проверять Интернет на наличие копий до 10 страниц.
Всякий раз, когда кто-то крадет ваш контент и публикует его в другом месте, Copyscape отправит вам предупреждение по электронной почте, чтобы вы приняли меры. Вы можете попросить удалить повторяющийся контент, запросить каноническую ссылку или подать заявку на удаление DMCA через раздел юридической помощи Google.
5. Объединяйте похожие страницы
Иногда страницы, на которых обсуждается одна и та же тема, содержат схожую информацию, которая может рассматриваться как дублирующаяся.
Например, у вас может быть список с перекрывающимися элементами, которые имеют почти идентичные описания продуктов. У вас также могут быть похожие целевые страницы с таргетингом на разные города, которые могут содержать кучу повторяющегося текста.
В обоих сценариях простое решение — объединить информацию в один пост.
Владельцам веб-сайтов также следует избегать использования общих шаблонов страниц, если только они не планируют выполнять сложные настройки. Это сводит к минимуму вероятность непреднамеренного создания дублированного контента, который может запутать читателей, а также роботов поисковых систем.
6. Будьте последовательны с внутренними ссылками
При создании внутренних ссылок на определенные страницы обязательно используйте один и тот же URL-адрес каждый раз.
Не ссылайтесь на «http://yoursite.com/blog/your-post/» в одной статье и на «https://www.yoursite.com/blog/your-post/» в другой. Использование одного URL-адреса для нескольких внутренних ссылок свидетельствует о том, что вы ссылаетесь на каноническую страницу.
Часто задаваемые вопросы
1. Что Google считает дублирующимся контентом?
Google определяет повторяющийся контент как блоки контента, которые содержат информацию, аналогичную или «заметно похожую» на существующий контент. Заменить несколько слов синонимами или даже перефразировать целые абзацы недостаточно, чтобы скрыть дублирующийся контент от Google.
2. Можно ли копировать описания продуктов?
Повторяющиеся описания товаров никак не влияют на SEO. Если вы не вводите читателей в заблуждение, не стесняйтесь использовать скопированные описания продуктов там, где они имеют смысл.
3. Как чаще всего устраняют дублированный контент?
Использование тега rel=canonical устраняет множество проблем с дублированием контента, от параметров динамического URL до синдикации контента. Это универсальное решение, которое сообщает Google, как найти оригинальный контент.
Избегайте дублирования контента, доминируя в своей отрасли
С помощью приведенных выше советов вы сможете избежать публикации дублированного контента и избежать его разрушительных последствий.
Если вам нужна стратегия контент-маркетинга, свободная от дублированного контента и способная стимулировать рост доходов и бизнеса, запланируйте звонок с нами прямо сейчас.
Наши менеджеры по успеху могут собрать (и управлять) команду опытных продюсеров, редакторов и писателей, чтобы удовлетворить все ваши потребности в контенте.