고아 페이지: SEO를 개선하기 위해 페이지를 찾고 수정하는 방법

게시 됨: 2022-09-11

고아 페이지 란 무엇입니까?

What is an Orphan Page — 고아 페이지 란 무엇입니까?

고아 페이지는 해당 페이지를 가리키는 링크가 없는 웹사이트의 페이지입니다. 이 페이지에는 크롤러나 사용자가 웹사이트를 탐색하는 동안 액세스할 수 있는 내부 연결이 없기 때문에 액세스할 수 없습니다.

일부 웹 사이트는 의도적으로 방문 페이지를 숨기기 때문에 고아 페이지에는 "오류" 태그가 아닌 "통지" 태그가 표시되는 경우가 많습니다.

고아 사이트는 검색 엔진에서 찾을 수 없으므로 웹사이트에서 해당 사이트를 확인하는 것이 중요합니다. 이는 Google이 웹사이트에서 새 웹페이지를 발견하는 방식 때문입니다.

크롤러는 XML 사이트맵에 언급된 페이지의 URL을 인식합니다.
크롤러는 내부 또는 외부의 다른 웹사이트에 연결된 URL을 찾습니다.

검색 엔진에서 웹페이지를 색인화하고 찾을 수 있도록 하려면 사이트에서 분리된 페이지를 찾아 적절한 단계를 수행해야 합니다.

Orphan Pages는 SEO 문제입니까?

Are Orphan Pages an SEO issue — Orphan Pages는 SEO 문제입니까?

검색 엔진이 링크를 통해 페이지를 찾을 수 없으면 일반적으로 무시됩니다. 웹페이지가 웹사이트의 XML 사이트맵에 포함되어 있어도 SEO에 여전히 문제가 될 수 있습니다.

고아 사이트는 오래된 정보를 포함하여 도메인 권한을 낮출 수 있습니다.
웹 사이트 마이그레이션 프로세스 중에 페이지가 자주 분리됩니다. 이는 고아 페이지에 순위를 높이는 데 도움이 되는 유용한 콘텐츠가 있을 수 있기 때문에 문제가 됩니다.
웹 사이트에 더 많은 고아 페이지가 있으면 콘텐츠 컨텍스트와 관련하여 검색 엔진을 혼동 시켜 SERP 순위를 낮출 수 있습니다.

고아 페이지 대 막다른 페이지

Orphan Pages vs. Dead End Pages — 고아 페이지 대 막다른 페이지

막다른 페이지와 고아 페이지의 차이점을 이해하는 것이 중요합니다.

"고아"라는 용어는 다른 페이지에 연결되거나 연결할 수 없는 페이지를 나타냅니다. 반면에 막다른 페이지는 크롤러나 사람들이 탐색할 수 있는 외부 또는 내부 웹사이트에 연결되지 않습니다. 결과적으로 "막다른 골목"이 만들어지므로 이 용어가 사용됩니다.

사용자가 막다른 페이지에 도달하면 웹사이트를 포기하거나 돌아가라는 두 가지 선택이 있습니다. 마찬가지로 검색 엔진 크롤러는 막다른 페이지에서 갈 곳이 없기 때문에 링크 자산을 전달할 수 없습니다.

막다른 페이지는 단순히 콘텐츠에 대한 링크를 추가하거나 사이드바/바닥글 탐색을 추가하여 수정할 수 있지만, 고아 페이지는 다릅니다. 고아 페이지를 찾고 수정하는 방법을 살펴보겠습니다.

또한 읽기: 마케팅이 사회에 미치는 영향

웹사이트에서 고아 페이지를 찾는 방법은 무엇입니까?

웹사이트 URL 목록 가져오기

고아 페이지를 찾는 것은 크롤러에게 시간이 많이 걸리고 때로는 불가능한 작업입니다. 결과적으로 SEO 도구를 사용하는 것은 크롤러가 수집한 데이터에 의존하기 때문에 어려울 수 있습니다.

고아 페이지를 감지하는 가장 좋은 방법은 Google Analytics 보고서를 사용하여 웹사이트의 모든 URL 목록을 컴파일하는 것입니다. 선택한 다른 분석 소프트웨어로 이 작업을 쉽게 수행할 수 있습니다.

페이지를 본 적이 있는 경우 해당 페이지가 Analytics 보고서에 나타납니다. 어딘가에 URL에 대한 기록이 있는데, 보고서의 페이지뷰 부분을 보면 쉽게 찾을 수 있을 것이다.

페이지 중복 문제 해결

고아 페이지가 가장 많이 발생하는 이유는 고려해볼 만한 것이 아닐 수도 있습니다. 페이지 중복은 자주 간과되는 문제이며 즉시 해결해야 합니다. 각 중복 페이지는 하나의 URL로만 리디렉션되어야 하며 그렇지 않은 경우 해당 페이지의 버전은 연결되지 않을 것입니다. 결과적으로 고아 페이지가 될 수 있습니다.

이러한 페이지가 중복된다는 사실은 이 상황에서 근본적인 문제입니다. 사이트 감사의 일환으로 웹사이트에서 고아 페이지를 찾을 때 이 페이지를 가장 먼저 검사해야 합니다. 주의해야 할 두 가지 유형의 페이지 복제가 있습니다.

1. 비정규 페이지

https 또는 http 프로토콜과 URL의 www 또는 non-www는 웹사이트의 각 페이지에서 일관되게 사용해야 합니다.

결과적으로 다음과 같이 브라우저에 페이지의 모든 변형을 넣어 각 공개 페이지를 검사해야 합니다.

https://www.xyz.com
http://www.xyz.com
https://xyz.com
http://xyz.com

이러한 모든 버전은 독자를 동일한 URL과 동일한 페이지로 안내해야 합니다. 그 결과 웹 페이지는 자체적으로 표준이 됩니다. 이러한 변형 중 하나라도 검색을 적절한 웹 페이지로 리디렉션하지 못하는 경우 일반적인 문제를 다루고 있는 것일 수 있습니다. 어떤 변형이 문제를 일으키는지 다른 웹사이트도 확인해야 합니다.

2. 후행 슬래시

이것은 중요한 영향을 미칠 수 있는 주시해야 할 또 다른 작은 세부 사항입니다. 웹사이트에서 후행 슬래시를 일관되게 사용하지 않으면 일부 페이지가 분리될 수 있습니다. 다른 시나리오를 살펴보겠습니다.

https://example.com/page1/
https://example.com/page1

이러한 URL은 방문자에게 동일한 콘텐츠를 전달할 수 있지만 URL은 다릅니다.

웹페이지에서 이 두 버전을 모두 확인하여 사용자가 동일한 페이지로 이동하고 있는지 확인합니다. 이 작업이 모든 웹페이지에서 균일하게 수행되는지 확인하세요. ".htaccess"를 사용하여 이 절차를 자체적으로 처리하고 이러한 모든 변형이 동일한 URL로 연결되도록 할 수 있습니다.

Google Analytics를 사용하여 크롤링 가능한 URL과 Analytics URL 목록 비교

이것은 웹사이트에서 고아 페이지를 찾는 가장 간단한 방법입니다. 이제 "사이트 콘텐츠" 영역으로 이동하여 "모든 페이지"를 클릭하여 웹사이트의 모든 URL을 수집하기만 하면 됩니다.

다음 섹션이 목록에 나타납니다.

페이지(URL)
페이지뷰
순 페이지뷰
페이지에 머문 평균 시간
날짜 범위

일반 페이지와 분리된 페이지를 구별하려면 날짜 범위 및 페이지뷰 섹션에 주의하십시오.

고아 페이지는 사용자가 액세스할 수 없기 때문에 가장 낮은 페이지 조회수를 갖게 됩니다. 가장 적게 방문한 사이트를 맨 앞에 표시하려면 "페이지뷰"를 클릭하기만 하면 됩니다. 그러면 고아 페이지가 가장 확실하게 뒤따를 것입니다.

또 다른 대안은 "날짜 범위"를 선택하고 필터의 시작 날짜를 Google Analytics가 설치된 시점까지로 지정하는 것입니다. Google Analytics는 한 번에 5,000개의 URL만 표시할 수 있으므로 하단의 "행 표시" 영역에서 가장 많은 행 수를 선택하십시오. 아마도 이것은 모든 고아 페이지를 덮을 것입니다.

모든 URL이 Google Analytics에 로드된 후 내보내기를 클릭하여 해당 URL의 CSV 또는 Excel 파일을 가져옵니다. Google Analytics API를 사용하여 작업 속도를 높일 수도 있습니다.

이 목록이 있는 경우 웹로그 분석 URL에서 크롤링 가능한 URL을 분리하는 데 필요한 기능만 추가하면 됩니다. 무슨 말인지 이해하려면 아래 이미지를 보세요.

그런 다음 Analytics URL 목록을 크롤링 가능한 URL 목록과 비교하여 목록의 고아 URL을 식별해야 합니다. 위 예의 마지막 링크인 "https://xyz.com/7"은 명백한 고아 페이지입니다. 실제로 이 목록은 상당히 크며 고아 페이지를 검색하려면 훨씬 더 많은 URL을 검색해야 합니다.

이 기계적 프로세스는 자동화하기 쉽습니다. 크롤링 가능 목록의 각 URL이 Analytics 목록에도 있는지 확인하려면 아래 일치 알고리즘을 사용하십시오.

"=일치(E2,$A$2:$A$11,0)"

해당 열을 따라 수식을 드래그하면 시트에 범위를 변경하지 말라고 달러 기호가 표시됩니다. 또한 값 "0"은 목록이 정렬되지 않았음을 Google에 알려줍니다.

이 알고리즘을 실행한 후 일치 항목이 범위의 첫 번째 위치로 복원됩니다. 크롤링 목록 필드에서 검색되지 않았기 때문에 일치하지 않는 항목은 "#NA" 오류와 함께 반환됩니다. 예를 들어 "https://xyz.com/7"은 다음과 같이 "#NA"와 함께 표시됩니다.

그러면 목록에 있는 모든 고아 페이지가 자동으로 표시됩니다. 이제 모든 #NA 결과를 필터링하기만 하면 됩니다.

Orphan URL을 찾기 위해 다른 도구의 도움을 받으세요.

방법을 파악한 후 웹사이트에서 고아 페이지를 찾는 데 도움이 되는 다양한 도구가 있습니다.

이를 위해 최상의 설정과 기능을 제공하는 도구는 다음과 같습니다.

모즈 링크 익스플로러
아레프스
샘러쉬
까마귀 도구

고아 페이지를 발견하는 것 외에도 이러한 모든 도구는 다양한 다른 작업을 수행하는 데 도움이 될 수 있는 풍부한 기능을 제공합니다. Ahrefs, Moz 및 SEMrush Opens in a new tab. 는 고아 페이지를 훨씬 더 빨리 찾는 데 도움이 되는 세 가지 도구입니다.

또 다른 이점은 이러한 도구가 웹사이트에서 직접 크롤링되지 않고 반드시 고아가 아닌 페이지를 찾아낼 수 있다는 것입니다. 이는 이러한 사이트에서 가치를 개선하고 생성하는 데 도움이 될 수 있습니다.

서버에서 개발 팀은 웹 사이트의 모든 URL 목록을 빠르게 컴파일할 수 있습니다. 다음에 대한 정보는 로그 파일을 살펴보기만 하면 됩니다.

귀하의 웹 사이트에 오는 사람은 누구입니까?
그들은 웹사이트에 방문할 때 어디에서 왔습니까?
그들은 어떤 페이지로 갔습니까?

이 정보는 전체 웹사이트의 두 번째 크롤링을 실행하는 데 큰 도움이 됩니다. "noindex" 및 "nofollow"와 같은 지시문을 무시하고 새 데이터를 이전 크롤링 데이터와 비교하여 누락된 분리된 페이지를 찾으면 이를 달성할 수 있습니다. 그 이유는 크롤러가 때때로 이러한 지시를 따르지 않는 페이지에 액세스하여 고아 페이지가 될 수 있기 때문입니다.

이 작업을 완료한 후 GSC의 검색 분석 보고서에서 URL 목록을 찾으십시오. 이러한 URL이 이미 인덱싱되었는지 궁금할 수 있습니다. 예, 이러한 페이지 중 일부는 여전히 웹사이트의 내부 링크를 통해 액세스할 수 없습니다. 이러한 페이지는 나중에 고아 페이지가 될 위험이 있지만 이러한 일이 발생하지 않도록 방지할 수 있습니다.

고아 페이지 수정 – 게임에서 앞서 나가기

고아 페이지는 특히 SEO 측면에서 웹사이트에 심각한 문제가 될 수 있습니다. 이제 고아 페이지를 찾는 방법을 알았으므로 고아 페이지를 수정하는 다음 단계를 살펴보겠습니다.

웹사이트의 고아 페이지를 모두 찾았으면 다음 단계는 처리할 가치가 있는 페이지와 제거해야 하는 페이지를 결정하는 것입니다. 다음은 이러한 결정을 내리기 위해 스스로에게 물어봐야 하는 질문입니다.

웹사이트 분류에서 페이지는 현재 어디에 있습니까?
페이지가 방문자에게 유용한가요? 그렇다면 웹 사이트 아키텍처의 어디에 배치해야 합니까?
페이지가 모든 키워드에 대해 순위를 매길 수 있습니까? 웹사이트의 SEO를 개선하기 위해 최적화할 수 있습니까?
페이지가 백링크될 수 있습니까? 아니면 페이지가 다른 웹사이트에서 링크될 가능성이 있습니까?
이 페이지의 내용이 다른 페이지의 내용과 유사합니까?

이러한 질문에 대한 답변은 고아 페이지를 유지 관리하거나 삭제할지 여부를 결정하는 데 도움이 됩니다. 또한 이 데이터를 사용하여 보존하는 페이지를 수정하는 데 얼마나 많은 노동력이 필요할지와 페이지가 제공하는 가치를 파악할 수 있습니다.