孤立頁面：如何查找和修復它們以改善 SEO

已發表: 2022-09-11

什麼是孤兒頁面？

孤立頁面是網站上沒有指向它的鏈接的頁面。 這些頁面無法訪問，因為它們沒有內部連接，爬蟲或用戶在瀏覽您的網站時可能會利用它們來訪問它們。

由於某些網站故意隱藏其登錄頁面，因此孤立頁面經常帶有“通知”標籤而不是“錯誤”標籤。

搜索引擎不會找到孤立網站，這就是為什麼檢查您的網站是否有它們至關重要的原因。這是由於 Google 在網站上發現新網頁的方式：

爬蟲識別您的 XML 站點地圖中提到的頁面的 URL。
爬蟲會在內部或外部尋找鏈接到另一個網站的 URL。

如果您希望網頁被搜索引擎索引並找到，您需要在您的網站上查找孤立頁面並執行適當的步驟。

孤立頁面是 SEO 問題嗎？

Are Orphan Pages an SEO issue — 孤立頁面是 SEO 問題嗎

當搜索引擎無法通過鏈接找到頁面時，通常會被忽略。即使您的網頁包含在您網站的 XML 站點地圖中，它仍然可能是 SEO 的問題：

孤立站點可能包含過時的信息，從而降低您的域權限。
在網站遷移過程中，頁面經常被孤立。這是一個問題，因為孤立頁面可能包含有用的內容，可以幫助您提高排名。
您網站上的更多孤立頁面可能會使搜索引擎對您的內容上下文感到困惑，從而降低您的 SERP 排名。

孤立頁面與死胡同頁面

Orphan Pages vs. Dead End Pages — 孤立頁面與死胡同頁面

了解死胡同頁面和孤立頁面之間的區別至關重要。

術語“孤兒”是指未連接到任何其他頁面或無法從任何其他頁面訪問的頁面。另一方面，死胡同頁面沒有鏈接到任何外部或內部網站供爬蟲或人們探索。結果，創建了“死胡同”，因此有了這個術語。

當用戶點擊死頁時，他或她有兩種選擇：放棄網站或返回。同樣，搜索引擎爬蟲也無法傳達任何鏈接權益，因為它們無處可去從死胡同頁面。

雖然可以通過簡單地添加內容鏈接或添加側邊欄/頁腳導航來修復任何死胡同頁面，但孤立頁面是不同的。讓我們看看如何定位和修復孤立頁面。

另請閱讀：營銷對社會的影響

如何在網站上找到孤立頁面？

獲取您網站 URL 的列表

對於爬蟲來說，查找孤立頁面是一項耗時且有時不可能完成的任務。因此，使用 SEO 工具將具有挑戰性，因為它們依賴於爬蟲收集的數據。

檢測孤立頁面的最佳技術是使用 Google Analytics（分析）報告來編譯您網站上所有 URL 的列表。您可以使用您選擇的任何其他分析軟件輕鬆完成此操作。

如果曾經查看過該頁面，它將出現在分析報告中。某處有 URL 記錄，如果您查看報告的綜合瀏覽量部分，您可能很容易找到它。

解決頁面重複問題

孤立頁面的最普遍原因可能不是您考慮的任何事情。頁面重複是一個經常被忽視的問題，應該立即解決。每個重複頁面應該只重定向到一個 URL，如果沒有，該頁面的版本肯定不會連接。結果，它們可能成為孤立頁面。

這些頁面是重複的這一事實是在這種情況下的根本問題。作為網站審核的一部分，在您的網站上尋找孤立頁面時，這應該是您首先檢查的地方。有兩種類型的頁面重複需要注意：

1.非規範頁面

https 或 http 協議，以及 URL 中的 www 或非 www，應在您網站的每個頁面上一致使用。

因此，您必須通過在瀏覽器中放入頁面的所有變體來檢查每個公共頁面，例如：

https://www.xyz.com
http://www.xyz.com
https://xyz.com
http://xyz.com

所有這些版本都應將讀者引導至具有相同 URL 的同一頁面。因此，網頁將成為其自身的規範。如果這些變體中的任何一個無法將搜索重定向到相應的網頁，您應該知道您可能正在處理一個常見問題。您還應該檢查其他網站，無論哪種變體導致問題。

2. 尾部斜線

這是另一個需要關注的微小細節，可能會產生重大影響。如果您沒有在您的網站上始終使用尾部斜杠，您的某些頁面可能會成為孤立的。讓我們看另一個場景：

https://example.com/page1/
https://example.com/page1

這些 URL 可能向訪問者提供相同的內容，但它們的 URL 是不同的。

檢查您的網頁是否有這兩個版本，以確定用戶是否被發送到同一頁面。確保在您的所有網頁上統一執行此操作。您可以使用“.htaccess”使此過程自行處理，並確保所有這些變體都指向相同的 URL。

使用 Google Analytics 比較可抓取 URL 和分析 URL 列表

這是在網站上查找孤立頁面的最直接方法。您現在所要做的就是轉到“站點內容”區域並單擊“所有頁面”以收集您網站的所有 URL。

以下部分將出現在列表中：

頁面（網址）
瀏覽量
獨特的網頁瀏覽量
平均頁面停留時間
日期範圍

要區分正常頁面和孤立頁面，請注意日期範圍和瀏覽量部分。

孤立頁面注定具有最低的頁面瀏覽量，因為用戶無法訪問它們。只需單擊“Pageviews”即可將訪問量最少的網站放在最前面，您的孤兒頁面肯定會緊隨其後。

另一種選擇是選擇“日期範圍”並指定過濾器的開始日期，早在安裝 Google Analytics 時。由於 Google Analytics 一次只能顯示 5,000 個 URL，因此請從底部的“顯示行”區域中選擇最多的行數。這很可能會涵蓋您所有的孤立頁面。

在 Google Analytics 中加載所有 URL 後，單擊導出以獲取它們的 CSV 或 excel 文件。您也可以使用 Google Analytics API 來幫助加快速度。

擁有此列表後，您只需添加所需的函數即可將可抓取的 URL 與 Analytics URL 分開。要了解我在說什麼，請看下圖：

然後應通過將 Analytics URL 列表與可抓取 URL 列表進行比較來識別列表中的孤立 URL。上例中的最後一個鏈接“https://xyz.com/7”是一個明顯的孤立頁面。實際上，這個列表會非常大，您必須搜索更多的 URL 才能發現孤立頁面。

這種機械過程很容易實現自動化。要檢查 Crawlable 列表中的每個 URL 是否也在 Analytics 列表中，請使用以下匹配算法：

“=匹配（E2，$A$2:$A$11,0）”

當公式沿相關列拖動時，美元符號告訴工作表不要更改範圍。此外，值“0”告訴 Google 該列表沒有排序。

運行此算法後，匹配項將恢復到範圍內的第一個位置。因為在可抓取列表字段中未檢測到它們，所以不匹配的將返回“#NA”錯誤。例如，“https://xyz.com/7”將顯示為“#NA”，如下所示：

這將自動為您顯示列表中的所有孤立頁面。您現在要做的就是過濾掉所有#NA 結果。

借助其他工具來發現您的孤立 URL

在您弄清楚如何做之後，有多種工具可幫助您在您的網站上找到孤立頁面。

為此目的提供最佳設置和功能的工具如下：

Moz 鏈接資源管理器
阿雷夫斯
SEMrush
烏鴉工具

除了發現孤立頁面之外，所有這些工具都提供了豐富的功能，可以幫助您完成各種其他任務。 Ahrefs、Moz 和 SEMrush Opens in a new tab. 這三個工具可以幫助您更快地找到孤立頁面。

另一個好處是，這些工具將發現您網站上未被直接抓取且不一定是孤立的頁面。這可以幫助您改進這些網站並從中產生價值。

從服務器，您的開發團隊可以快速編譯您網站的所有 URL 列表。您所要做的就是查看日誌文件以獲取以下信息：

訪問您網站的人是誰？
當他們訪問網站時，他們來自哪裡？
他們去了哪些頁面？

此信息將極大地幫助您運行整個網站的第二次爬網。您可以通過忽略諸如“noindex”和“nofollow”之類的指令並將新數據與舊的爬網數據進行比較來定位丟失的孤立頁面來實現這一點。這樣做的原因是爬蟲有時可以訪問不遵守這些指令的頁面，從而導致孤立頁面。

完成此操作後，在 GSC 的搜索分析報告中查找 URL 列表。您可能想知道這些 URL 是否已被編入索引。是的，儘管其中一些頁面可能仍無法通過您網站的內部鏈接訪問。這些頁面將來有成為孤立頁面的風險，但您可以防止這種情況發生。

修復孤立頁面——在遊戲中取得領先

孤立頁面對您的網站來說可能是一個重大問題，尤其是在 SEO 方面。 讓我們看下一個階段，即修復孤立頁面，因為您知道如何找到它們。

當您找到您網站的所有孤立頁面後，接下來的步驟是確定哪些是值得處理的，哪些應該被淘汰。以下是您在做出此決定時應該問自己的問題：

該頁面現在位於您網站的分類中的什麼位置？
該頁面對訪問者有用嗎？如果是這樣，它應該放置在您網站的架構中的哪個位置？
頁面是否可以對任何關鍵字進行排名？是否可以對其進行優化以改善您網站的 SEO？
頁面是否有可能被反向鏈接？或者該頁面是否有可能從其他網站鏈接到？
此頁面上的內容是否與其他頁面上的內容相似？

這些問題的答案將幫助您決定是否維護或刪除孤立頁面。您還可以使用這些數據來計算修復您保留的頁面需要多少勞動力以及它們將提供多少價值。