Страницы-сироты: как найти и исправить их для улучшения SEO
Опубликовано: 2022-09-11Что такое страница-сирота?

Потерянная страница — это страница на веб-сайте, на которую нет ссылок, указывающих на нее. Эти страницы недоступны, потому что у них нет внутренних подключений, которые поисковые роботы или пользователи могут использовать для доступа к ним во время навигации по вашему веб-сайту.
Поскольку некоторые веб-сайты намеренно скрывают свои целевые страницы, страницы-сироты часто представляются с тегом «уведомление», а не с тегом «ошибка».
Сайты-сироты не будут найдены поисковыми системами, поэтому очень важно проверять ваш сайт на их наличие. Это связано с тем, как Google обнаруживает новые веб-страницы на веб-сайте:
- Сканеры распознают URL-адреса страниц, упомянутых в вашей XML-карте сайта.
- Сканеры ищут URL-адреса, которые связаны с другим веб-сайтом либо внутри, либо снаружи.
Если вы хотите, чтобы веб-страница была проиндексирована и найдена поисковыми системами, вам необходимо найти потерянные страницы на вашем сайте и выполнить соответствующие действия.
Являются ли страницы-сироты проблемой SEO?

Когда поисковая система не может найти страницу по ссылкам, она обычно игнорируется. Даже если ваша веб-страница включена в XML-карту сайта вашего веб-сайта, это все равно может быть проблемой для SEO:
- Сайты-сироты могут содержать устаревшую информацию, что снижает авторитет вашего домена.
- В процессе миграции веб-сайта страницы часто теряются. Это проблема, потому что страницы-сироты могут содержать полезный контент, который может помочь вам улучшить ваш рейтинг.
- Больше бесхозных страниц на вашем веб-сайте может сбить с толку поисковые системы в отношении контекста вашего контента, тем самым понизив ваши позиции в поисковой выдаче.
Страницы-сироты против тупиковых страниц

Крайне важно понимать разницу между тупиковыми страницами и страницами-сиротами.
Термин «сирота» относится к страницам, которые не связаны с другими страницами и не доступны с них. С другой стороны, тупиковые страницы не связаны с какими-либо внешними или внутренними веб-сайтами для поисковых роботов или людей. В результате создается «тупик», отсюда и термин.
Когда пользователь попадает на тупиковую страницу, у него есть два варианта: покинуть сайт или вернуться. Сканеры поисковых систем также не могут передать какой-либо ссылочный вес, потому что им некуда идти с тупиковых страниц.
В то время как любую тупиковую страницу можно исправить, просто добавив ссылки на контент или добавив боковые панели/нижний колонтитул навигации, страницы-сироты отличаются. Давайте посмотрим, как найти и исправить страницы-сироты.
ТАКЖЕ ЧИТАЙТЕ: Влияние маркетинга на общество
Как найти страницы-сироты на сайте?
Получите список URL-адресов вашего веб-сайта
Поиск потерянных страниц — трудоемкая, а иногда и невыполнимая задача для поисковых роботов. В результате использование инструмента SEO будет затруднительным, поскольку они полагаются на данные, собранные поисковыми роботами.
Лучший способ обнаружить потерянную страницу — использовать отчет Google Analytics для составления списка всех URL-адресов на вашем веб-сайте. Вы можете легко сделать это с любым другим программным обеспечением для аналитики, которое вы выберете.
Страница появится в отчете Google Analytics, если ее когда-либо просматривали. Где-то есть запись URL-адреса, и если вы посмотрите на часть отчета о просмотрах страниц, вы можете легко ее найти.
Устранение дубликатов страниц
Возможно, что самая распространенная причина потерянных страниц — это даже не то, что вы могли бы подумать. Дублирование страниц — это проблема, которой часто пренебрегают, и ее следует решать немедленно. Каждая повторяющаяся страница должна перенаправлять только на один URL-адрес, и если это не так, версии этой страницы наверняка не будут связаны. В результате они могут стать потерянными страницами.
Тот факт, что эти страницы являются дубликатами, является фундаментальной проблемой в этом случае. При поиске потерянных страниц на вашем веб-сайте в рамках аудита сайта это должно быть первым местом, которое вы должны проверить. Существует два типа дублирования страниц, на которые следует обратить внимание:
1. Неканонические страницы

Протоколы https или http, а также www или не www в URL-адресах должны последовательно использоваться на каждой странице вашего веб-сайта.
В результате вы должны проверить каждую из ваших общедоступных страниц, вставив все варианты ваших страниц в браузер, например:
- https://www.xyz.com
- http://www.xyz.com
- https://xyz.com
- http://xyz.com
Все эти версии должны вести читателей на одну и ту же страницу с одним и тем же URL-адресом. В результате веб-страницы станут каноническими сами по себе. Если какой-либо из этих вариантов не перенаправляет поиск на соответствующую веб-страницу, знайте, что вы, возможно, имеете дело с распространенной проблемой. Вы также должны проверить другие веб-сайты, в зависимости от того, какой вариант вызывает проблему.
2. Конечная косая черта

Это еще одна крошечная деталь, на которую следует обратить внимание и которая может оказать существенное влияние. Если вы не будете постоянно использовать завершающие косые черты на своем веб-сайте, некоторые из ваших страниц могут стать потерянными. Давайте рассмотрим другой сценарий:
- https://example.com/page1/
- https://example.com/page1
Эти URL-адреса могут предоставлять посетителям один и тот же контент, но их URL-адреса различаются.
Проверьте обе эти версии на своих веб-страницах, чтобы определить, перенаправляются ли пользователи на одну и ту же страницу. Убедитесь, что это делается единообразно на всех ваших веб-страницах. Вы можете использовать «.htaccess», чтобы эта процедура выполнялась сама по себе и чтобы все эти варианты приводили к одному и тому же URL-адресу.

Сравните список URL-адресов для сканирования и URL-адресов Google Analytics с помощью Google Analytics.
Это самый простой способ найти страницы-сироты на веб-сайте. Все, что вам нужно сделать сейчас, это перейти в область «Содержимое сайта» и нажать «Все страницы», чтобы собрать все URL-адреса вашего веб-сайта.
В списке появятся следующие разделы:
- Страница (URL)
- Просмотры страниц
- Уникальные просмотры страниц
- Среднее время на странице
- Диапазон дат
Чтобы различать нормальные страницы и страницы-сироты, обратите внимание на разделы «Диапазон дат» и «Просмотры страниц».
Страницы-сироты предназначены для самых низких просмотров страниц, потому что они недоступны для пользователей. Просто нажмите «Просмотры страниц», чтобы вывести наименее посещаемые сайты на передний план, и страницы-сироты наверняка последуют за ними.
Другой вариант — выбрать «Диапазон дат» и указать дату начала действия фильтра, начиная с момента установки Google Analytics. Поскольку Google Analytics может одновременно отображать только 5000 URL-адресов, выберите наибольшее количество строк в области «Показать строки» внизу. По всей вероятности, это охватит все ваши страницы-сироты.
После того, как все ваши URL-адреса будут загружены в Google Analytics, нажмите «Экспорт», чтобы получить их в формате CSV или Excel. Вы также можете использовать Google Analytics API, чтобы ускорить процесс.
Вам нужно только добавить необходимые функции для отделения URL-адресов для сканирования от URL-адресов Analytics после того, как у вас будет этот список. Чтобы понять, о чем я говорю, посмотрите на изображение ниже:

Бесхозные URL-адреса в списке затем должны быть идентифицированы путем сравнения списка URL-адресов Google Analytics со списком URL-адресов, доступных для сканирования. Последняя ссылка в приведенном выше примере, «https://xyz.com/7», — очевидная страница-сирота. На практике этот список будет довольно большим, и вам придется просмотреть гораздо больше URL-адресов, чтобы обнаружить потерянную страницу.
Этот механический процесс легко автоматизировать. Чтобы проверить, есть ли каждый URL в списке для сканирования также в списке Google Analytics, используйте приведенный ниже алгоритм сопоставления:
«= совпадение (E2, $A$2:$A$11,0)»
Когда формула перетаскивается вдоль соответствующего столбца, знаки доллара указывают листу не менять диапазон. Кроме того, значение «0» сообщает Google, что список не упорядочен.
Совпадения будут восстановлены в первое место в диапазоне после запуска этого алгоритма. Поскольку они не были обнаружены в поле Crawlable List, те, которые не совпадают, будут возвращены с ошибкой «#NA». Например, «https://xyz.com/7» будет отображаться с «#NA» следующим образом:

Это автоматически отобразит все страницы-сироты в списке для вас. Все, что вам нужно сделать сейчас, это отфильтровать все результаты #NA.
Воспользуйтесь помощью других инструментов, чтобы обнаружить потерянные URL-адреса.
Существует множество инструментов, которые помогут вам найти страницы-сироты на вашем веб-сайте после того, как вы поймете, как это сделать.
Инструменты, обеспечивающие наилучшие настройки и функции для этой цели, следующие:
- Обозреватель ссылок Moz
- Арефс
- SEMrush
- Инструменты Ворона
Помимо обнаружения потерянных страниц, все эти инструменты предоставляют множество возможностей, которые могут помочь вам в решении множества других задач. Ahrefs, Moz и SEMrush — это три инструмента, которые могут помочь вам гораздо быстрее найти потерянные страницы.
Еще одним преимуществом является то, что эти инструменты обнаружат страницы на вашем веб-сайте, которые не сканируются напрямую и не обязательно являются потерянными. Это может помочь вам в улучшении и получении ценности от этих сайтов.
С сервера ваша команда разработчиков может быстро составить список всех URL-адресов вашего веб-сайта. Все, что вам нужно сделать, это просмотреть файлы журнала для получения информации о:
- Кто это, что приходит на ваш сайт?
- Откуда они берутся, когда заходят на сайт?
- На какие страницы они заходили?
Эта информация очень поможет вам при повторном сканировании всего вашего веб-сайта. Вы можете добиться этого, игнорируя такие директивы, как «noindex» и «nofollow», и сравнивая новые данные со старыми данными сканирования, чтобы найти потерянные страницы, которые были пропущены. Причина этого в том, что поисковые роботы могут иногда получать доступ к страницам, которые не подчиняются этим директивам, что приводит к появлению потерянных страниц.
Найдите список URL-адресов в отчете Google Search Analytics после завершения этой операции. Вам может быть интересно, были ли эти URL-адреса уже проиндексированы. Да, хотя некоторые из этих страниц могут быть недоступны по внутренним ссылкам вашего веб-сайта. Эти страницы рискуют стать потерянными в будущем, но вы можете предотвратить это.
Исправление страниц-сирот — вперед в игре

Страницы-сироты могут стать серьезной проблемой для вашего сайта, особенно с точки зрения SEO. Давайте рассмотрим следующий этап, который заключается в исправлении потерянных страниц теперь, когда вы знаете, как их найти.
Когда вы нашли все страницы-сироты вашего веб-сайта, следующим шагом будет решить, какие из них стоит исправить, а какие следует удалить. Ниже приведены вопросы, которые вы должны задать себе, чтобы принять это решение:
- Где теперь находится страница в таксономии вашего веб-сайта?
- Полезна ли страница посетителям? Если да, то где в архитектуре вашего веб-сайта он должен быть размещен?
- Может ли страница ранжироваться по любым ключевым словам? Можно ли оптимизировать его для улучшения SEO вашего сайта?
- Возможно ли, что страница будет иметь обратную ссылку? Или на эту страницу можно ссылаться с других веб-сайтов?
- Похож ли контент на этой странице на любой другой?
Ответы на эти вопросы помогут вам принять решение о сохранении или удалении потерянных страниц. Вы также можете использовать эти данные, чтобы выяснить, сколько труда потребуется для исправления сохраненных вами страниц и какую ценность они принесут.