什麼是日誌文件分析以及為什麼它對 SEO 很重要?
已發表: 2022-03-16SEO 日誌文件分析有助於了解爬蟲在網站上的行為並識別潛在的技術 SEO 優化機會。
不分析爬蟲行為的 SEO 就像瞎了眼。 您可能已經在 Google 搜索控制台上提交了網站並將其編入索引,但如果不研究日誌文件,您將無法了解您的網站是否被搜索引擎機器人正確抓取或讀取。
這就是為什麼我收集了您需要知道的一切來分析 SEO 日誌文件並從中識別問題和 SEO 機會。
什麼是日誌文件分析?

SEO 日誌文件分析是識別搜索引擎機器人與網站交互模式的過程。 日誌文件分析是技術 SEO 的一部分。
日誌文件審核對於 SEO 識別和解決與爬網、索引、狀態代碼相關的問題非常重要。
什麼是日誌文件?

日誌文件跟踪誰訪問了網站以及他們查看了哪些內容。 它們包含有關誰請求訪問網站的信息(也稱為“客戶”)。
感知到的信息可能與 Google 或 Bing 等搜索引擎機器人或網站訪問者有關。 通常,日誌文件記錄由站點的 Web 服務器收集和維護,並且通常會保留一定的時間。
日誌文件包含什麼?

在了解日誌文件對 SEO 的重要性之前,了解此文件中的內容至關重要。 日誌文件 e 包含以下數據點:-
- 網站訪問者請求的頁面 URL
- 頁面的 HTTP 狀態碼
- 請求的服務器 IP 地址
- 命中日期和時間
- 發出請求的用戶代理(搜索引擎機器人)的數據
- 請求方法(GET/POST)
如果您先查看日誌文件,您可能會覺得它們很複雜。 儘管如此,一旦您知道日誌文件對 SEO 的目的和重要性,您將有效地使用它們來生成有價值的 SEO 見解。
SEO 日誌文件分析的目的
日誌文件分析有助於解決一些重要的技術 SEO 問題,這使您可以創建有效的 SEO 策略來優化網站。
以下是一些可以使用日誌文件分析的 SEO 問題:
#1。 Googlebot 抓取網站的頻率
搜索引擎機器人或爬蟲應經常抓取您的重要頁面,以便搜索引擎了解您的網站更新或新內容。
您的重要產品或信息頁面都應該出現在 Google 的日誌中。 您不再銷售的產品的產品頁面以及缺少任何最重要的類別頁面都是可以使用日誌文件識別的問題的指標。
搜索引擎機器人如何利用抓取預算?
每次搜索引擎爬蟲訪問您的網站時,它的“爬網預算”都是有限的。 Google 將抓取預算定義為網站抓取率和抓取需求的總和。
如果網站有許多低價值的 URL 或未在站點地圖中正確提交的 URL,則可能會阻礙對網站的抓取和索引。 如果您的抓取預算得到優化,抓取和索引關鍵頁面會更容易。
日誌文件分析有助於優化加速 SEO 工作的爬網預算。
#2。 移動優先索引問題和狀態
移動優先索引現在對所有網站都很重要,谷歌更喜歡它。 日誌文件分析將告訴您智能手機 Googlebot 抓取您網站的頻率。
如果智能手機 Googlebot 未正確抓取頁面,此分析可幫助網站管理員針對移動版本優化網頁。
#3。 網頁在請求時返回的 HTTP 狀態碼
我們的網頁返回的最近響應代碼可以通過日誌文件或使用 Google Search Console 中的獲取和呈現請求選項來檢索。

日誌文件分析器可以找到具有 3xx、4xx 和 5xx 代碼的頁面。 您可以通過採取適當的措施來解決這些問題,例如,將 URL 重定向到正確的目標或將 302 狀態編碼更改為 301。
#4。 分析抓取活動,如抓取深度或內部鏈接
Google 會根據其抓取深度和內部鏈接來欣賞您的網站結構。 網站抓取不當的原因可能是不良的鏈接結構和抓取深度。
如果您對網站的層次結構或站點結構或鏈接結構有任何困難,您可以使用日誌文件分析來找到它們。
日誌文件分析有助於優化網站架構和鏈接結構。
#4。 發現孤立頁面
孤立頁面是網站上沒有從任何其他頁面鏈接的網頁。 這些頁面很難被索引或出現在搜索引擎中,因為它們不容易被機器人發現。
孤立頁面很容易被 Screaming Frog 之類的爬蟲發現,並且可以通過將這些頁面鏈接到網站上的其他頁面來解決此問題。
#5。 審核頁面的頁面速度和體驗
頁面體驗和核心網絡生命力現在正式成為排名因素,現在重要的是網頁符合 Google 頁面速度指南。
可以使用日誌文件分析器發現慢速或大頁面,並且可以針對頁面速度優化這些頁面,這將有助於 SERP 的整體排名。
日誌文件分析可幫助您控製網站的抓取方式以及搜索引擎如何處理您的網站
現在,當我們清楚了日誌文件及其分析的基礎知識後,讓我們看看為 SEO 審核日誌文件的過程
如何進行日誌文件分析
我們已經研究了日誌文件的不同方面以及 SEO 的重要性。 現在,是時候學習分析文件的過程和分析日誌文件的最佳工具了。
您需要訪問網站的服務器日誌文件才能訪問日誌文件。 可以通過以下方式分析文件:
- 手動使用 Excel 或其他數據可視化工具
- 使用日誌文件分析工具

手動訪問日誌文件涉及不同的步驟。
- 從網絡服務器收集或導出日誌數據,並且應該為搜索引擎機器人或爬蟲過濾數據。
- 使用數據分析工具將下載的文件轉換為可讀格式。
- 使用 excel 或其他可視化工具手動分析數據,以發現 SEO 差距和機會。
- 您還可以使用過濾程序和命令行來簡化您的工作
手動處理文件數據並不容易,因為它需要 Excel 知識並且涉及開發團隊。 儘管如此,用於日誌文件分析的工具使 SEO 的工作變得容易。
讓我們看看審計日誌文件的頂級工具,並了解這些工具如何幫助我們分析日誌文件。
尖叫青蛙日誌文件分析器

可以使用上傳的日誌文件數據和使用 Screaming Frog 日誌文件分析器驗證的搜索引擎機器人來識別技術 SEO 問題。 您還可以執行以下操作:

- 用於搜索引擎優化的搜索引擎機器人活動和數據。
- 通過搜索引擎機器人發現網站的抓取頻率
- 了解所有技術 SEO 問題以及外部和內部斷開的鏈接
- 分析被抓取最少和最多的URL,減少損失,提高效率。
- 發現未被搜索引擎抓取的頁面。
- 可以比較和組合任何數據,包括外部鏈接數據、指令和其他信息。
- 查看有關引用 URL 的數據
Screaming Frog 日誌文件分析器工具完全免費用於單個項目,限制為 1000 行日誌事件。 如果您想要無限制訪問和技術幫助,則需要升級到付費版本。
噴射章魚

當談到負擔得起的日誌分析工具時,JetOctopus 是最好的。 它有 7 天的免費試用期,無需信用卡,並且只需點擊兩下即可連接。 就像我們列表中的其他工具一樣,使用 JetOctopus 日誌分析器可以識別抓取頻率、抓取預算、最受歡迎的頁面等等。
使用此工具,您可以將日誌文件數據與 Google Search Console 數據集成,從而在競爭中獲得明顯優勢。 通過此組合,您將能夠了解 Googlebot 如何與您的網站互動,以及您可以在哪些方面進行改進。
關於爬取日誌分析器

Oncrawl Log Analyzer 每天處理超過 5 億條日誌行,該工具專為大中型網站設計。 它會實時關注您的網絡服務器日誌,以確保您的頁面被正確索引和抓取。
Oncrawl 日誌分析器符合 GDPR 且高度安全。 該程序將所有日誌文件存儲在安全且隔離的 FTP 雲中,而不是 IP 地址。
除了 JetOctopus 和 Screaming Frog 日誌文件分析器,Oncrawl 還有一些功能,例如:
- 支持多種日誌格式,如 IIS、Apache 和 Nginx。
- 工具可以輕鬆適應您的處理和存儲要求,因為它們會發生變化
- 動態分段是一種強大的工具,可通過根據各種標準對 URL 和內部鏈接進行分組來發現數據中的模式和連接。
- 使用原始日誌文件中的數據點創建可操作的 SEO 報告。
- 在技術人員的幫助下,可以自動傳輸到您的 FTP 空間的日誌文件。
- 可以監控所有流行的瀏覽器,包括 Google、Bing、Yandex 和百度的爬蟲。
OnCrawl 日誌分析器有兩個更重要的工具:
Oncrawl SEO Crawler:使用 Oncrawl SEO Crawler,您可以用最少的資源高速抓取您的網站。 提高用戶對排名標準如何影響搜索引擎優化 (SEO) 的理解。
Oncrawl 數據: Oncrawl 數據通過結合來自抓取和分析的數據來分析所有 SEO 因素。 它從爬取和日誌文件中獲取數據以了解爬取行為,並將爬取預算推薦給優先內容或排名頁面。
SEMrush 日誌文件分析器

SEMrush 日誌文件分析器是基於瀏覽器的簡單日誌分析工具的明智選擇。 該分析儀無需下載,在線版即可使用。
SEMrush 為您呈現兩份報告:
Pages' Hits : Pages' Hits 報告網絡爬蟲與您網站內容的交互。 它為您提供與機器人交互最多和最少的頁面、文件夾和 URL 的數據。
Googlebot 的活動:Googlebot 活動報告每天提供與網站相關的見解,例如:
- 爬取文件的類型
- 整體 HTTP 狀態碼
- 各種機器人向您的網站發出的請求數
來自 SolarWinds 的 Loggly

SolarWinds 的 Loggly 會檢查您的 Web 服務器的訪問和錯誤日誌,以及該站點的每週指標。 您可以在任何時間點查看您的日誌數據,並且它具有使搜索日誌變得簡單的功能。
需要像 SolarWinds Loggly 這樣強大的日誌文件分析工具來有效地挖掘 Web 服務器上的日誌文件,以獲取有關客戶端資源請求成功或失敗的信息。
Loggly 可以提供圖表顯示最不常查看的頁面,併計算平均、最小和最大頁面加載速度,以幫助您優化網站的搜索引擎優化。
谷歌搜索控制台抓取統計

谷歌搜索控制台通過提供有用的實踐概述讓用戶更輕鬆。 控制台的操作很簡單。 然後,您的抓取統計信息將分為三類:
- 每天下載的千字節數:表示谷歌機器人在訪問網站時下載的千字節數。 這基本上表明了兩個重要點:如果圖表中顯示較高的平均值,則意味著該網站被更頻繁地抓取,或者也可能表明該機器人需要很長時間來抓取一個網站並且它不是輕量級的。
- 每天抓取的頁面數:它會告訴您 Googlebot 每天抓取的頁面數。 它還記下爬網活動狀態,無論是低、高還是平均。 低抓取率表示該網站未被 Googlebot 正確抓取
- 下載頁面所用的時間(以毫秒為單位):這表示 Googlebot 在抓取網站時發出 HTTP 請求所用的時間。 Googlebot 發出請求所花費的時間越少,下載頁面的效果就會越好,因為索引編制會更快。
結論
我希望您從本指南中獲得了很多關於日誌文件分析和用於審核 SEO 日誌文件的工具的信息。 審核日誌文件對於改進網站的技術 SEO 方面非常有效。
Google Search Console 和 SEMrush Log File Analyzer 是免費和基本分析工具的兩個選項。 作為替代方案,檢查 Screaming Frog Log File Analyzer、JetOctopus 或 Oncrawl Log Analyzer 以更好地了解搜索引擎機器人如何與您的網站交互; 您可以為 SEO 使用混合的高級和免費日誌文件分析工具。
您還可以查看一些高級網站爬蟲來改善 SEO。