Дублированный контент и SEO: полное руководство

Опубликовано: 2022-09-11

Представьте, что вы размещаете содержимое своего сайта на другом сайте! Не имеет значения, был ли дублированный контент на вашем сайте размещен там по ошибке или кто-то украл блоки контента с вашего сайта. Вы должны действовать быстро, чтобы исправить ситуацию.

Также не имеет значения, руководите ли вы крошечным бизнесом или гигантской многонациональной компанией; дублированный контент представляет собой опасность для любого SEO-дружественного веб-сайта.

Давайте посмотрим, как обнаружить дублированный контент и определить, влияет ли он на производительность вашего веб-сайта внутри или между доменами.

Что такое дублированный контент?

Duplicate Content
Дублированный контент

Контент, который похож или является точной копией контента на других веб-сайтах или на нескольких страницах одного и того же веб-сайта, называется дублированным контентом. Наличие большого количества дублированного контента на вашем сайте может повредить вашему рейтингу в Google.

Другими словами:

Дублированный контент — это контент, который дословно идентичен контенту на другой странице. Однако «Повторяющиеся материалы» включают контент, похожий на другой контент… даже если он немного переписан.

Какая связь между дублирующимся контентом и SEO?

Google не налагает никаких санкций за дублирование контента. Однако, поскольку основные поисковые системы фильтруют идентичный контент, ваши посетители могут быть перенаправлены, что приведет к штрафу. В результате рейтинг сайта будет страдать. Дублированный контент является источником путаницы Google, поскольку вынуждает поисковую систему выбирать между идентичными страницами для целей ранжирования.

Возможно, не имеет значения, кто создал исходный контент, потому что исходный контент может не быть выбран для ранжирования в поисковой выдаче. Это одна из многих причин, по которым дублирование контента является одной из ошибок SEO, которых следует избегать.

Подумайте о том, чтобы нанять специалиста по SEO, который поможет вам в этом. Дублированный контент больше не будет проблемой, а SEO-услуги станут относительно недорогими.

Какие элементы на странице являются важными?

Чтобы избежать проблем с дублированием контента, убедитесь, что каждая страница вашего веб-сайта имеет собственное мета-описание и заголовок страницы в HTML-коде. Такие заголовки, как h1, h2 и h3, должны отличаться от заголовков на других страницах сайта.

Хотя мета-описание, заголовок и заголовки составляют небольшую часть контента вашего веб-сайта, лучше держаться как можно дальше от серой зоны дублированного контента. Это отличный способ заставить поисковые системы оценить ценность метаописаний на вашем веб-сайте.

Как дублированный контент влияет на SEO?

Google не хочет ранжировать страницы с дублирующимся контентом.

На самом деле, согласно Google:

«Google делает все возможное, чтобы индексировать и отображать страницы с уникальной информацией».

В результате наличие на вашем сайте страниц, лишенных четкой информации, повредит результатам вашей поисковой системы. Вот три наиболее распространенные проблемы, с которыми сталкиваются сайты с большим количеством дублированного контента.

Меньше органического трафика:

Это довольно очевидно. Google не хочет, чтобы страницы, содержащие контент, скопированный с других страниц в его индексе, ранжировались. (Это могут быть страницы с вашего собственного веб-сайта.)

Давайте представим, что у вас есть три страницы на вашем сайте, каждая из которых имеет сопоставимое содержание.

Less Organic Traffic
Меньше органического трафика

Google не уверен, является ли из этих двух страниц «оригиналом». В результате всем трем страницам будет сложно ранжироваться.

Duplicate pages will all struggle to rank
Дублированные страницы будут бороться за ранжирование

Штраф (крайне редко):

По словам Google, дублированный контент может привести к штрафу или полной деиндексации веб-сайта.

Penalty
Пенальти

Однако это довольно редко. И это делается только тогда, когда веб-сайт намеренно копирует или дублирует контент с других веб-сайтов.

duplicate content penalty
Штраф за дублирование контента

Так что, как правило, вам не нужно беспокоиться о «штрафе за дублирование контента», если на вашем сайте много повторяющихся страниц.

Меньше проиндексированных страниц:

Это особенно важно для сайтов с большим количеством страниц (например, сайтов электронной коммерции).

Fewer Indexed Pages
Меньше проиндексированных страниц

Дублированный контент не всегда понижается в рейтинге Google. Он не будет индексировать его вообще.

Если страницы вашего сайта не индексируются, возможно, ваш краулинговый бюджет расходуется на дублирование контента.

Лучшие практики

Следите за одним и тем же контентом на разных URL-адресах

Это наиболее типичная причина проблем с дублированием контента.

Давайте представим, что вы владелец интернет-магазина.

Вы также предлагаете футболки на странице продукта.

example product page
пример страницы продукта

Если все сделано правильно, эта футболка будет доступна во всех размерах и цветах по одному и тому же URL-адресу.

Product with all variations
Товар со всеми вариациями

Однако вы можете обнаружить, что ваш сайт генерирует новый URL-адрес для каждой новой версии вашего продукта… Это приводит к ТЫСЯЧАМ страниц с дублирующимся контентом.

Проверить проиндексированные страницы

Изучение количества страниц вашего сайта, проиндексированных в Google, — один из самых простых способов обнаружить дублированный контент.

Вы можете сделать это, зайдя в Google и набрав site:example.com.

Check Indexed Pages
Проверить проиндексированные страницы

Кроме того, перейдите в консоль поиска Google и посмотрите на свои проиндексированные страницы.

Убедитесь, что ваш сайт перенаправляется правильно

У вас не всегда есть несколько версий одной и той же страницы… иногда у вас есть разные версии одного и того же САЙТА.

Хотя это редкость, я много раз наблюдал это в дикой природе.

Эта проблема возникает, когда «WWW-версия» вашего веб-сайта не перенаправляет на «не-WWW-версию».

Это также может произойти, если вы не перенаправили HTTP-сайт после перехода на HTTPS.

Другими словами, все несколько версий вашего сайта должны оказаться в одном и том же месте.

Make Sure Your Site Redirects Correctly
Убедитесь, что ваш сайт перенаправляется правильно

Используйте 301 редиректы

Самый простой способ решить проблемы с дублированием контента на вашем сайте — использовать переадресацию 301. Если вы обнаружите на своем сайте множество страниц с повторяющимся контентом, просто перенаправьте их на оригинал. Когда робот Googlebot придет в гости, он оценит перенаправление и проиндексирует ТОЛЬКО оригинальный контент.

Следите за похожим контентом

Дублированный контент не всегда означает контент, который дословно дублируется из другого источника.

По правде говоря, Google определяет дублированный контент следующим образом: у вас все еще могут быть проблемы с дублированным контентом, даже если ваш контент технически отличается от того, что там есть.

Google - duplicate content
Google — дублированный контент

По большей части это не проблема. Большинство веб-сайтов имеют несколько десятков страниц. Они также пишут уникальный контент для каждой страницы. Однако в некоторых случаях может появляться «похожий» дублированный контент.

Требуется ли много времени для создания 100-процентного уникального контента для каждой страницы вашего сайта? Ага. Тем не менее, это необходимо, если вы серьезно относитесь к ранжированию каждой страницы вашего сайта.

Используйте канонический тег

Canonical-tag
Канонический тег

Поисковые системы понимают, что означает тег rel=canonical:

«Да, на нашем сайте есть несколько страниц с дублирующимся контентом. Тем не менее, это исходная страница. На остальное можно не обращать внимания».

По мнению Google, использование канонического тега предпочтительнее, чем блокировка страниц с дублирующимся контентом.

Use the Canonical Tag
Используйте канонический тег

(Например, используя robots.txt или элемент noindex в HTML-коде веб-страницы, чтобы заблокировать робота Googlebot.)

Итак, если вы обнаружите множество дубликатов страниц на своем сайте, вы можете:

  • Удалите их из уравнения.
  • Их следует перенаправить.
  • Следует использовать канонический тег.

Используйте инструмент

Есть несколько SEO-инструментов, которые имеют функцию обнаружения дублированного контента.

Siteliner Opens in a new tab. , например, ищет на вашем веб-сайте страницы с большим количеством дублированного контента.

siteliner
сайтлайнер

Объединить страницы

Как я уже говорил ранее, если у вас есть несколько сайтов с одинаковым контентом, вам, вероятно, следует перенаправить их на одну страницу.

Но что, если у вас есть страницы с похожим контентом? Однако вы можете создать уникальный контент для каждой страницы… ИЛИ объединить их в одну мега-страницу.

Noindex тег WordPress или страницы категорий

Если вы используете WordPress, вы могли заметить, что страницы тегов и категорий генерируются автоматически. На этих страницах много дублированного контента.

Рекомендую добавить на эти страницы тег «noindex», чтобы они были полезны пользователям. Таким образом, они могут существовать без индексации поисковыми системами. В качестве альтернативы вы можете настроить WordPress так, чтобы эти страницы вообще не создавались.

Что такое скопированный контент?

Сокращение контента происходит, когда один владелец веб-сайта извлекает контент с другого, чтобы улучшить органическую видимость. Эти веб-мастера пытаются убедить машины переписать содержимое, полученное ими с других веб-сайтов.

Сокращенный контент иногда легко обнаружить, потому что воры часто не пытаются обновлять фирменные термины в контенте. Если вас поймают на попытке манипулировать поисковым индексом Google, ваш сайт будет ранжироваться намного ниже или, возможно, полностью удален из результатов поиска.

Заключительные слова

Также важно избегать непреднамеренного дублирования, потому что это может привести к штрафу со стороны Google, который повлияет на весь ваш контент сразу.

1) Убедитесь, что каждое слово авторское, а не просто копируете и вставляете текст или фотографии, не добавляя ничего нового, чтобы обеспечить оригинальность.

2) Правильно используйте ключевые слова, чтобы ваш контент оставался актуальным.

3) По возможности используйте синонимы.

Алгоритмы Google постоянно обновляются, чтобы выявлять спам-сайты и наказывать их.