Как решить проблемы с дублирующимся контентом на вашем сайте

Опубликовано: 2019-06-11

Дублированный контент является серьезной проблемой SEO. Это связано с хитрыми ссылками и избеганием штрафов Google. Наличие дублированного контента может нанести ущерб органическому трафику любого сайта. Это понимают все, кто занимается SEO. Это не означает, что дублированного контента легко избежать. Несмотря на все ваши усилия, ваш сайт все еще может страдать от проблем с дублированием контента.

Это руководство предназначено, чтобы помочь вам решить эти проблемы. Мы собираемся указать вам на основные причины возникновения дублированного контента. Затем мы подробно рассмотрим, что вы можете сделать, чтобы избежать и решить проблемы с дублированием контента. Однако сначала стоит объяснить, что такое дублированный контент и почему он важен.

Заказать консультацию

Дублированный контент и Google

Лучший способ объяснить, что такое дублированный контент, — это посмотреть, как его определяет сам Google. В своих рекомендациях по поддержке дублированного контента они предлагают следующее определение:

«Основные блоки контента внутри или между доменами, которые либо полностью совпадают с другим контентом, либо заметно похожи».

Это достаточно просто, поэтому важно дублировать контент. Это из-за того, как это влияет на то, что Google стремится предоставить своим пользователям. Поисковая система стремится индексировать и отображать страницы с четкой информацией. Это часть их постоянного желания обеспечить лучший пользовательский опыт.

Страницы с дублирующимся содержимым не считаются содержащими отдельную информацию. Таким образом, Google будет фильтровать эти дублирующиеся страницы. Это означает, что будет указана только одна из страниц с дублирующимся контентом. Это может оказать сильное негативное влияние на органический трафик домена. Страницы, которые в противном случае привлекли бы больше трафика на сайт, вообще не будут перечислены.

Это распространенное заблуждение, что Google налагает штрафы за дублированный контент. Это не так, но если они заподозрят злонамеренное использование дублированного контента, они будут действовать. Это было бы, когда контент используется для манипулирования их рейтингом. В таком случае они:

«Внесите соответствующие коррективы в индексацию и ранжирование задействованных сайтов. В результате может пострадать рейтинг сайта или сайт может быть полностью удален из индекса Google. В этом случае он больше не будет отображаться в результатах поиска».

К настоящему моменту должно быть очевидно, что вы хотите избежать дублирования контента на своем сайте. Даже если вы делаете это осторожно, это все равно может произойти. Это может произойти разными способами.

Как может появиться дублированный контент

Как мы уже упоминали, дублированный контент может быть преднамеренно размещен в домене. Обычно как способ обмануть или манипулировать рейтингом Google. Теперь каждый SEO-специалист знает, насколько умны алгоритмы Google. Только самые глупые или невнимательные из них могут подумать, что такие манипуляции сойдут им с рук.

Гораздо чаще бывает так, что дублированный контент на сайте возникает естественным образом. Это будет связано либо с определенными техническими проблемами, либо с простой человеческой ошибкой. Важно понимать основные пути, по которым это может произойти. Это поможет вам выявить собственные проблемы с дублирующимся контентом. Это также облегчит выбор наилучшего возможного решения.

Причины дублирования контента, которые мы собираемся обсудить, следующие:

  • Параметры URL для фильтрации и отслеживания
  • Пересечение страницы категории продукта
  • Дублирование описаний товаров.
  • Технические проблемы с URL
  • Страницы для печати
  • Проблемы с созданием контента

Параметры URL для фильтрации и отслеживания

Параметры URL похожи на суффиксы, добавляемые в конец URL-адреса страницы. Они возникают во многих ситуациях и часто не сильно меняют содержимое страницы или вообще не меняют его. Проблема в том, что для поисковой системы URL-адрес с другим параметром в конце является другим URL-адресом. Если контент, на который ссылаются «два» URL-адреса, одинаков, Google идентифицирует его как дублированный контент.

Ярким примером этого является фильтрация продуктов на сайтах электронной коммерции. Почти все эти типы сайтов позволяют покупателям фильтровать продукты. Они могут захотеть показать только товары в определенном ценовом диапазоне или сделанные из определенного материала. Действие фильтрации продуктов добавляет к URL-адресу параметр URL. Однако показанный контент — продукты и т. д. — будет дублироваться в другом месте.

Другой пример касается отслеживания. Параметры отслеживания позволяют отслеживать источники посетителей вашего сайта. Это может иметь решающее значение для мониторинга рентабельности инвестиций в SEO. Они могут выглядеть примерно так: '/?source=rss'. Они не влияют на содержание страницы, но также воспринимаются поисковой системой как уникальный URL-адрес.

Страница категории продукта Кроссовер

Также проблемой, характерной для сайтов электронной коммерции, является пересечение страниц категорий. Многие сайты будут иметь разные страницы категорий, которые отображают в основном одни и те же продукты. Часто это делается из лучших побуждений и по понятным причинам.

Например, на сайте подарков могут быть категории «Подарки для него» и «Подарки на День отца». Эти две категории вполне могут привлекать разных клиентов. Однако продукты, отображаемые на страницах категорий, будут практически идентичными. Это все, что будет иметь значение для Google, и они вполне могут проиндексировать только одну из страниц.

Дублирование описаний продуктов

На один уровень ниже на сайтах электронной коммерции от страниц категорий находятся страницы продуктов. Они также могут быть распространенным источником проблем с дублированным содержимым. Посетители таких страниц ожидают увидеть краткое описание продукта. Это будет то, как свойства и характеристики продукта продаются покупателям.

Сайты, которые продают много товаров, часто не создают уникальных описаний для каждого из них. Многие фирмы просто копируют и вставляют общую информацию. Часто это было предоставлено поставщиком или производителем. Это приводит к большому количеству дублированного контента внутри и между разными доменами.

Самые большие проблемы в этом случае будут, если ваш сайт продает те же продукты, что и более крупный ритейлер, такой как Amazon. Скопированные описания могут привести к тому, что страница вашего продукта будет дублировать контент, найденный на Amazon. Google определенно проиндексирует страницу Amazon, а не вашу.

Технические проблемы с URL-адресами

Помимо параметров URL-адресов, существует еще несколько технических проблем с URL-адресами, которые могут привести к дублированию контента. Первый представлен в виде «идентификаторов сеансов». Они используются в URL-адресах, когда посетителям сайта предоставляется «сеанс». Часто это делается для того, чтобы они могли добавить товары в корзину и оставить их там.

Идентификаторы сеанса добавляются к каждой внутренней ссылке, когда посетитель перемещается по вашему сайту. Это создает множество URL-адресов, которые поисковая система может рассматривать как дублирующийся контент. Точно так же неаккуратные URL-адреса как часть CMS могут иметь аналогичный эффект. URL-адреса с параметрами для категории и статьи, которые меняют порядок, являются яркими примерами.

Страницы для печати

Ваша CMS вполне может создавать удобные для печати страницы. На эти страницы будут ссылаться на вашем сайте со страниц статей и в других местах. Google сможет найти эти страницы, если вы специально не остановите их (подробнее об этом позже).

Google будет фильтровать и индексировать только одну из дубликатов страниц. Это может быть оригинал или версия для печати. Вы хотите, чтобы ваша исходная страница ранжировалась, а не страница для печати. На последнем не будет всей вашей рекламы, ссылок и другого контента.

Проблемы с созданием контента

Большинство из вышеперечисленных причин являются техническими причинами дублирования контента. Где возникает человеческая ошибка, так это в области создания контента. Почти на каждом сайте в наши дни есть блог или подобный информационный ресурс. Это помогает им предоставлять полезную информацию посетителям. Блоги часто могут быть домом для большого количества дублированного контента.

Это может быть связано с тем, что вы доверяете создание контента тому, кому не должны. Кто-то, кто не понимает проблем, которые может вызвать дублирование контента. Они могут копировать или воссоздавать контент, не зная о проблемах SEO, которые они создают. Их ошибки могут быть такими же незначительными, как и при использовании одних и тех же тегов заголовков. Они могут быть такими большими, как прямое копирование контента с других сайтов.

Решение проблем с дублирующимся содержимым

Теперь у вас должно быть представление о том, откуда могут возникнуть ваши проблемы с дублирующимся контентом. Все вышеперечисленное является причиной тех проблем, которые являются общими для многих сайтов. Понимание их и знание того, какие из них повлияли на ваш сайт, имеет решающее значение. Это потому, что разные причины поддаются различным решениям.

Мы рассмотрим некоторые из лучших способов решения проблем с дублирующимся контентом. Мы отметим, какие из проблем и причин, которые мы уже упоминали, лучше всего подходят для каждого решения по мере продвижения. Наши решения подпадают под две категории:

  • Образовательные и профилактические решения
  • Практические решения и усилия по восстановлению

Образовательные и профилактические решения

В идеальном мире вы хотите избежать проблем с дублированием контента до того, как они возникнут. Знание причин проблем, которые мы обсуждали, является отличной отправной точкой. Наличие этих знаний может помочь вам предпринять шаги, чтобы ни один новый контент не столкнулся с теми же проблемами.

Например, вы можете отключить идентификаторы сеансов в настройках вашей системы. Это предотвратит проблемы с повторяющимися URL-адресами, которые могут возникнуть. Вы можете вообще отказаться от включения страниц для печати на своем веб-сайте. В любом случае, сегодня у многих людей нет причин распечатывать страницы. Кампания по отслеживанию на основе хэштегов также может быть хорошей альтернативой отслеживанию на основе параметров.

Узнав о причинах дублирования контента, вы сможете обучать других. Среди них могут быть веб-разработчики или ваша продуктовая команда. Вы можете объяснить им вопросы, связанные с кроссовером в категориях продуктов. Таким образом, они будут знать, как расположить продукты соответствующим образом. Внештатные или штатные создатели контента также могут быть проинструктированы о том, как сохранять уникальность.

То есть в идеальном мире. На самом деле вы не сможете решить все проблемы с дублирующимся контентом. В этих обстоятельствах вам нужны некоторые практические решения. Они помогут вам избавиться от проблем, от которых вы уже страдаете.

Практические решения и усилия по восстановлению

Наше руководство должно было показать вам, откуда могут возникнуть проблемы с дублирующимся контентом. Теперь мы также предложили несколько советов, как избежать возникновения новых проблем. Осталось предложить несколько вариантов действий, если на вашем сайте уже есть проблемы с дублирующимся контентом. Перед вами открыто множество различных вариантов.

Канонические URL-адреса

Канонические URL-адреса могут помочь, если ваша проблема связана с разными URL-адресами, ведущими к одному и тому же контенту. Как и в случае параметров фильтрации или страниц категорий, как описано ранее. Канонический URL — это «правильный» URL. Это URL-адрес страницы, которую вы хотите, чтобы Google проиндексировал из тех, которые ведут к тому же контенту. Вы должны решить в каждом случае, что это за страница.

После определения Google легко сообщить, какая страница является вашим каноническим URL-адресом. Все, что вам нужно сделать, это добавить элемент HTML в раздел <head> других страниц. Называется «канонический элемент ссылки» и выглядит так: 'отн = канонический'. Он укажет Google на выбранную вами страницу, когда за ней последует ее URL.

301 редиректы

Указание Google на канонические URL-адреса иногда описывается как использование «мягкой переадресации». Это в отличие от полноценной переадресации 301. Вы также можете использовать их, если не можете или не хотите удалять повторяющийся контент.

Применение перенаправления 301 к URL-адресу направит Google на выбранную вами страницу. Тогда это будет та страница, которую проиндексирует поисковая система. Это может быть полезным решением проблемы перекрытия страниц категорий товаров.

Все, что вам нужно сделать, это определить, какая из категорий наиболее ценна для вас с точки зрения веб-трафика. Затем вы можете использовать переадресацию 301 с других дубликатов или перекрывающихся страниц в эту категорию.

Безиндексные теги

Тег Noindex — это директива, которую можно добавить в исходный HTML-код страницы. Он явно сообщает Google, что вы не хотите, чтобы страница была проиндексирована. Это может помешать Google отфильтровать страницу, которую вы хотите проиндексировать, в пользу той, которую вы не хотите.

Теги Noindex — лучшее решение для проблем, вызванных страницами, удобными для печати. Вы должны применить тег Noindex к каждой из этих страниц. Это гарантирует, что исходная версия каждой страницы будет индексироваться Google.

Переписывание контента

Иногда проблемы с дублирующимся контентом просто не имеют быстрого решения. Это тот случай, если ваша проблема связана с сообщениями в блогах или описаниями продуктов. Если они создали дублированный контент, вам нужно найти оскорбительную копию и переписать ее. Это решение отнимает много времени и сил. Другого способа справиться с проблемой просто нет.

Один из способов сэкономить немного времени и усилий — использовать бесплатный онлайн-инструмент, такой как Copyscape. Copyscape разработан, чтобы помочь вам писать контент, который не является плагиатом. Вы можете вставить URL-адрес на сайт, и он будет искать в Интернете дублированный контент. Это позволяет вам найти точные элементы вашего контента, которые вам нужно вырезать, заменить или переписать.