Страницы-сироты: как найти и исправить их для улучшения SEO

Опубликовано: 2022-09-11

Что такое страница-сирота?

What is an Orphan Page — Что такое страница-сирота

Потерянная страница — это страница на веб-сайте, на которую нет ссылок, указывающих на нее. Эти страницы недоступны, потому что у них нет внутренних подключений, которые поисковые роботы или пользователи могут использовать для доступа к ним во время навигации по вашему веб-сайту.

Поскольку некоторые веб-сайты намеренно скрывают свои целевые страницы, страницы-сироты часто представляются с тегом «уведомление», а не с тегом «ошибка».

Сайты-сироты не будут найдены поисковыми системами, поэтому очень важно проверять ваш сайт на их наличие. Это связано с тем, как Google обнаруживает новые веб-страницы на веб-сайте:

Сканеры распознают URL-адреса страниц, упомянутых в вашей XML-карте сайта.
Сканеры ищут URL-адреса, которые связаны с другим веб-сайтом либо внутри, либо снаружи.

Если вы хотите, чтобы веб-страница была проиндексирована и найдена поисковыми системами, вам необходимо найти потерянные страницы на вашем сайте и выполнить соответствующие действия.

Являются ли страницы-сироты проблемой SEO?

Are Orphan Pages an SEO issue — Являются ли страницы-сироты проблемой SEO

Когда поисковая система не может найти страницу по ссылкам, она обычно игнорируется. Даже если ваша веб-страница включена в XML-карту сайта вашего веб-сайта, это все равно может быть проблемой для SEO:

Сайты-сироты могут содержать устаревшую информацию, что снижает авторитет вашего домена.
В процессе миграции веб-сайта страницы часто теряются. Это проблема, потому что страницы-сироты могут содержать полезный контент, который может помочь вам улучшить ваш рейтинг.
Больше бесхозных страниц на вашем веб-сайте может сбить с толку поисковые системы в отношении контекста вашего контента, тем самым понизив ваши позиции в поисковой выдаче.

Страницы-сироты против тупиковых страниц

Orphan Pages vs. Dead End Pages — Страницы-сироты против тупиковых страниц

Крайне важно понимать разницу между тупиковыми страницами и страницами-сиротами.

Термин «сирота» относится к страницам, которые не связаны с другими страницами и не доступны с них. С другой стороны, тупиковые страницы не связаны с какими-либо внешними или внутренними веб-сайтами для поисковых роботов или людей. В результате создается «тупик», отсюда и термин.

Когда пользователь попадает на тупиковую страницу, у него есть два варианта: покинуть сайт или вернуться. Сканеры поисковых систем также не могут передать какой-либо ссылочный вес, потому что им некуда идти с тупиковых страниц.

В то время как любую тупиковую страницу можно исправить, просто добавив ссылки на контент или добавив боковые панели/нижний колонтитул навигации, страницы-сироты отличаются. Давайте посмотрим, как найти и исправить страницы-сироты.

ТАКЖЕ ЧИТАЙТЕ: Влияние маркетинга на общество

Как найти страницы-сироты на сайте?

Получите список URL-адресов вашего веб-сайта

Поиск потерянных страниц — трудоемкая, а иногда и невыполнимая задача для поисковых роботов. В результате использование инструмента SEO будет затруднительным, поскольку они полагаются на данные, собранные поисковыми роботами.

Лучший способ обнаружить потерянную страницу — использовать отчет Google Analytics для составления списка всех URL-адресов на вашем веб-сайте. Вы можете легко сделать это с любым другим программным обеспечением для аналитики, которое вы выберете.

Страница появится в отчете Google Analytics, если ее когда-либо просматривали. Где-то есть запись URL-адреса, и если вы посмотрите на часть отчета о просмотрах страниц, вы можете легко ее найти.

Устранение дубликатов страниц

Возможно, что самая распространенная причина потерянных страниц — это даже не то, что вы могли бы подумать. Дублирование страниц — это проблема, которой часто пренебрегают, и ее следует решать немедленно. Каждая повторяющаяся страница должна перенаправлять только на один URL-адрес, и если это не так, версии этой страницы наверняка не будут связаны. В результате они могут стать потерянными страницами.

Тот факт, что эти страницы являются дубликатами, является фундаментальной проблемой в этом случае. При поиске потерянных страниц на вашем веб-сайте в рамках аудита сайта это должно быть первым местом, которое вы должны проверить. Существует два типа дублирования страниц, на которые следует обратить внимание:

1. Неканонические страницы

Non Canonical Pages — Неканонические страницы

Протоколы https или http, а также www или не www в URL-адресах должны последовательно использоваться на каждой странице вашего веб-сайта.

В результате вы должны проверить каждую из ваших общедоступных страниц, вставив все варианты ваших страниц в браузер, например:

https://www.xyz.com
http://www.xyz.com
https://xyz.com
http://xyz.com

Все эти версии должны вести читателей на одну и ту же страницу с одним и тем же URL-адресом. В результате веб-страницы станут каноническими сами по себе. Если какой-либо из этих вариантов не перенаправляет поиск на соответствующую веб-страницу, знайте, что вы, возможно, имеете дело с распространенной проблемой. Вы также должны проверить другие веб-сайты, в зависимости от того, какой вариант вызывает проблему.

2. Конечная косая черта

Это еще одна крошечная деталь, на которую следует обратить внимание и которая может оказать существенное влияние. Если вы не будете постоянно использовать завершающие косые черты на своем веб-сайте, некоторые из ваших страниц могут стать потерянными. Давайте рассмотрим другой сценарий:

https://example.com/page1/
https://example.com/page1

Эти URL-адреса могут предоставлять посетителям один и тот же контент, но их URL-адреса различаются.

Проверьте обе эти версии на своих веб-страницах, чтобы определить, перенаправляются ли пользователи на одну и ту же страницу. Убедитесь, что это делается единообразно на всех ваших веб-страницах. Вы можете использовать «.htaccess», чтобы эта процедура выполнялась сама по себе и чтобы все эти варианты приводили к одному и тому же URL-адресу.

Сравните список URL-адресов для сканирования и URL-адресов Google Analytics с помощью Google Analytics.

Это самый простой способ найти страницы-сироты на веб-сайте. Все, что вам нужно сделать сейчас, это перейти в область «Содержимое сайта» и нажать «Все страницы», чтобы собрать все URL-адреса вашего веб-сайта.

В списке появятся следующие разделы:

Страница (URL)
Просмотры страниц
Уникальные просмотры страниц
Среднее время на странице
Диапазон дат

Чтобы различать нормальные страницы и страницы-сироты, обратите внимание на разделы «Диапазон дат» и «Просмотры страниц».

Страницы-сироты предназначены для самых низких просмотров страниц, потому что они недоступны для пользователей. Просто нажмите «Просмотры страниц», чтобы вывести наименее посещаемые сайты на передний план, и страницы-сироты наверняка последуют за ними.

Другой вариант — выбрать «Диапазон дат» и указать дату начала действия фильтра, начиная с момента установки Google Analytics. Поскольку Google Analytics может одновременно отображать только 5000 URL-адресов, выберите наибольшее количество строк в области «Показать строки» внизу. По всей вероятности, это охватит все ваши страницы-сироты.

После того, как все ваши URL-адреса будут загружены в Google Analytics, нажмите «Экспорт», чтобы получить их в формате CSV или Excel. Вы также можете использовать Google Analytics API, чтобы ускорить процесс.

Вам нужно только добавить необходимые функции для отделения URL-адресов для сканирования от URL-адресов Analytics после того, как у вас будет этот список. Чтобы понять, о чем я говорю, посмотрите на изображение ниже:

Бесхозные URL-адреса в списке затем должны быть идентифицированы путем сравнения списка URL-адресов Google Analytics со списком URL-адресов, доступных для сканирования. Последняя ссылка в приведенном выше примере, «https://xyz.com/7», — очевидная страница-сирота. На практике этот список будет довольно большим, и вам придется просмотреть гораздо больше URL-адресов, чтобы обнаружить потерянную страницу.

Этот механический процесс легко автоматизировать. Чтобы проверить, есть ли каждый URL в списке для сканирования также в списке Google Analytics, используйте приведенный ниже алгоритм сопоставления:

«= совпадение (E2, $A$2:$A$11,0)»

Когда формула перетаскивается вдоль соответствующего столбца, знаки доллара указывают листу не менять диапазон. Кроме того, значение «0» сообщает Google, что список не упорядочен.

Совпадения будут восстановлены в первое место в диапазоне после запуска этого алгоритма. Поскольку они не были обнаружены в поле Crawlable List, те, которые не совпадают, будут возвращены с ошибкой «#NA». Например, «https://xyz.com/7» будет отображаться с «#NA» следующим образом:

Это автоматически отобразит все страницы-сироты в списке для вас. Все, что вам нужно сделать сейчас, это отфильтровать все результаты #NA.

Воспользуйтесь помощью других инструментов, чтобы обнаружить потерянные URL-адреса.

Существует множество инструментов, которые помогут вам найти страницы-сироты на вашем веб-сайте после того, как вы поймете, как это сделать.

Инструменты, обеспечивающие наилучшие настройки и функции для этой цели, следующие:

Обозреватель ссылок Moz
Арефс
SEMrush
Инструменты Ворона

Помимо обнаружения потерянных страниц, все эти инструменты предоставляют множество возможностей, которые могут помочь вам в решении множества других задач. Ahrefs, Moz и SEMrush Opens in a new tab. — это три инструмента, которые могут помочь вам гораздо быстрее найти потерянные страницы.

Еще одним преимуществом является то, что эти инструменты обнаружат страницы на вашем веб-сайте, которые не сканируются напрямую и не обязательно являются потерянными. Это может помочь вам в улучшении и получении ценности от этих сайтов.

С сервера ваша команда разработчиков может быстро составить список всех URL-адресов вашего веб-сайта. Все, что вам нужно сделать, это просмотреть файлы журнала для получения информации о:

Кто это, что приходит на ваш сайт?
Откуда они берутся, когда заходят на сайт?
На какие страницы они заходили?

Эта информация очень поможет вам при повторном сканировании всего вашего веб-сайта. Вы можете добиться этого, игнорируя такие директивы, как «noindex» и «nofollow», и сравнивая новые данные со старыми данными сканирования, чтобы найти потерянные страницы, которые были пропущены. Причина этого в том, что поисковые роботы могут иногда получать доступ к страницам, которые не подчиняются этим директивам, что приводит к появлению потерянных страниц.

Найдите список URL-адресов в отчете Google Search Analytics после завершения этой операции. Вам может быть интересно, были ли эти URL-адреса уже проиндексированы. Да, хотя некоторые из этих страниц могут быть недоступны по внутренним ссылкам вашего веб-сайта. Эти страницы рискуют стать потерянными в будущем, но вы можете предотвратить это.

Исправление страниц-сирот — вперед в игре

Fixing Orphan Pages — Исправление потерянных страниц

Страницы-сироты могут стать серьезной проблемой для вашего сайта, особенно с точки зрения SEO. Давайте рассмотрим следующий этап, который заключается в исправлении потерянных страниц теперь, когда вы знаете, как их найти.

Когда вы нашли все страницы-сироты вашего веб-сайта, следующим шагом будет решить, какие из них стоит исправить, а какие следует удалить. Ниже приведены вопросы, которые вы должны задать себе, чтобы принять это решение:

Где теперь находится страница в таксономии вашего веб-сайта?
Полезна ли страница посетителям? Если да, то где в архитектуре вашего веб-сайта он должен быть размещен?
Может ли страница ранжироваться по любым ключевым словам? Можно ли оптимизировать его для улучшения SEO вашего сайта?
Возможно ли, что страница будет иметь обратную ссылку? Или на эту страницу можно ссылаться с других веб-сайтов?
Похож ли контент на этой странице на любой другой?

Ответы на эти вопросы помогут вам принять решение о сохранении или удалении потерянных страниц. Вы также можете использовать эти данные, чтобы выяснить, сколько труда потребуется для исправления сохраненных вами страниц и какую ценность они принесут.