SEO中的主題建模——排名更高的新方法

已發表: 2022-04-24

SEO中的主題建模是使用統計模型來發現文檔集合中的主題。 通過檢查數千個頁面中單詞和短語的共同出現,算法能夠將主題相關性分配給頁面並根據搜索查詢對頁面進行排名。

Topic Modeling In SEO – A Beginner’s Guide

目錄
從關鍵字到主題
主題建模與主題分類
兩種類型的主題建模
潛在狄利克雷分配 (LDA)
潛在語義分析
主題集群 - 排名更高的關鍵
支柱帖子和主題集群
為什麼主題集群有助於 SEO?
主題建模工具
市場繆斯
研究工具
競爭工具
優化工具
問題工具
文章見解
結論
相關資源

從關鍵字到主題

在搜索引擎的早期 - 1990 年代後期 - 算法所做的只是將結果中的關鍵字與查詢中的關鍵字進行匹配。 搜索引擎不理解查詢的上下文或關鍵字背後的意圖。

但從那時起,搜索引擎已經走了很長一段路。 搜索引擎算法現在不僅能理解關鍵字,還能理解關鍵字背後的主題。 這種對主題而不是關鍵字的強調稱為語義搜索引擎優化。

2013 年 Google 蜂鳥更新在理解主題方面取得了第一個重大進展。那時 Google 開始分析整個短語,而不僅僅是單個關鍵字。

2015 年,Google 的 RankBrain 算法向前邁出了一大步,該算法使用自然語言處理 (NLP) 來理解搜索查詢背後的上下文和意圖。

到這個時候,作為相關性衡量標準的關鍵詞密度正在後視鏡中迅速消失。 它正在被主題相關性所取代。 您現在在 Google 上的排名如何取決於您的內容涵蓋該主題的全面程度。

從那時起,谷歌和其他搜索引擎在理解主題方面越來越好。 他們通過一種稱為主題建模的技術來做到這一點。

主題建模與主題分類

主題建模是一種統計方法,用於發現單詞和短語之間存在的關係。

通過主題建模,該算法可以在無監督的情況下發現信息本身的類別。 它通過掃描一組文檔並根據單詞和短語與其他單詞和短語一起出現的頻率對它們進行聚類來做到這一點。 主題建模是一種“無監督”學習技術:算法根據發現的模式自行發現類別。

主題建模與主題分類不同,後者是一種機器學習技術,人類必須通過給定規則來“訓練”算法。

使用主題分類,您首先需要定義要使用的信息類別。 然後,您為算法提供了一些原始數據示例,這些示例已使用這些預定義類別進行了標記。 然後,該算法使用這些預定義的類別來分析數據。

這兩種技術的區別在於:在主題分類中,人類告訴算法類別是什麼,而在主題建模中,算法通過對單詞和短語如何以特定模式聚集在一起的統計分析來發現類別是什麼。

這些文本分析方法不僅被搜索引擎使用,而且被整個互聯網使用。

例如,收到大量在線客戶反饋的企業可能會使用主題建模或主題分類將其反饋分類,例如購買後通知、體驗跟進、品牌忠誠度反饋、客戶投訴和客戶評論。

兩種類型的主題建模

到目前為止,我一直在使用術語“主題建模”,就好像它是一個單一的東西一樣。 但它實際上是一個涵蓋一系列不同技術的總稱。

現在讓我們看看一些不同類型的主題建模。

潛在狄利克雷分配 (LDA)

潛在狄利克雷分配(LDA)基於兩個假設:相似的主題使用相似的詞,並且文檔討論了可以檢測到統計分佈的幾個主題。

LDA 通過將主題分配給諸如 n-gram 之類的單詞排列,將文檔映射到主題列表。 n-gram 是自然語言處理中使用的單詞序列。

指示符“n”指的是 n-gram 中的單詞數。 其中 N=1,n-gram 包含一個單詞,其中 N=2,n-gram 包含兩個單詞,依此類推。

例如,句子“The cow jumps over the moon”將包含以下 2 個單詞的 n-gram(稱為 bi-gram):

  • 牛跳
  • 跳過
  • 超過
  • 月亮

一旦你有了 n-gram,你就可以進行計算來預測某些單詞出現在同一個句子或同一個段落中,或者彼此相距一定距離的可能性。

潛在狄利克雷分配假設文檔由特定的單詞排列組成,並且這些排列決定了文檔的主題。

潛在語義分析

與 LDA 一樣,潛在語義分析基於分佈假設:可以通過查看單詞出現的上下文來掌握單詞的含義。 正如英國語言學家 JR Firth 所說:“您將通過它所擁有的公司知道一個詞”(Firth, JR 1957:11)。

與將主題分配給特定單詞排列的 LDA 不同,潛在語義分析只是計算單詞在一組文檔中出現的頻率。 它假設屬於相似主題的文檔將包含某些詞的詞頻分佈大致相同。

它用於計算詞頻的方法是詞頻-逆文檔頻率或 tf-idf。

詞頻 (TF) 是指關鍵字在單個文檔中出現的次數。

逆文檔頻率 (IDF),衡量該術語在文檔集合中出現的次數。

然後將詞頻 (TF) 除以逆文檔頻率 (IDF) 以獲得 TF-IDF 值。

LDA 和 LSA 都是無監督技術。

主題集群 - 排名更高的關鍵

如您所見,搜索引擎正在將注意力從關鍵字轉向主題。 他們正在使用各種統計方法來識別某些單詞與其他單詞一起發現的模式。 這些模式允許搜索引擎識別主題。

這就是為什麼主題集群現在是搜索結果中排名靠前的重要部分。

Google 希望提供權威的搜索結果。 這意味著提供在深度和廣度上很好地涵蓋某個主題的內容。

支柱帖子和主題集群

最好的方法是使用主題集群模型。 那是一組頁面,其中有一個稱為支柱的中心頁面。 支柱帖子深入涵蓋了該主題,通常至少有 3000 字長。

在支柱帖子中,您涵蓋了與您的主題相關的所有子主題。 但是您不一定要非常詳細地討論這些子主題。 花幾段介紹每個子主題,然後鏈接到單獨的博客文章,在其中更詳細地介紹該子主題。

例如,您的支柱帖子可能是關於“花園工具”的。 那將是一篇比一般文章更長的文章,您將簡要描述所有主要類型的園藝工具:割草機、修剪機、綠籬機、修枝剪、覆蓋機、吹葉機、磨邊工具、灑水器等。

然後,您將為每個子主題創建一個單獨的內容,並從支柱帖子鏈接到這些文章。

為什麼主題集群有助於 SEO?

主題集群如何幫助您獲得更高的排名? 它向搜索引擎顯示您的網站對特定主題具有主題權限。 當您創建主題集群時,您的內容將充滿相關的關鍵字。 這正是搜索引擎算法現在正在尋找的東西。 一個網站有十或十五頁密切相關的內容,其中充滿了通常一起找到的關鍵字,將從算法中獲得綠燈。

到目前為止,在本文中,我們已經研究了為什麼主題正在取代關鍵字成為 SEO 的重點,以及搜索引擎如何使用各種主題建模工具來理解主題及其子主題。

作為內容創建者,您可能想知道是否有主題建模工具可以幫助您“繪製”特定主題,以便您可以創建全面涵蓋該主題的內容。

好吧,毫不奇怪,這樣的工具已經存在。 在下一節中,我將向您展示其中的兩個。

主題建模工具

本節為您提供兩個主題建模工具的演練,它們將幫助您編寫具有高主題權威的內容。

市場繆斯

MarketMuse 是一個人工智能驅動的內容研究和關鍵字規劃工具。 它使用機器學習和人工智能來分析內容,建議要涵蓋的主題,並製定簡報以幫助您創建更好的內容。

當您登錄 MarketMuse 時,您會在左側菜單中看到五個工具:研究、競爭、優化、問題和連接:

MarketMuse tools

讓我們一一看看這些工具。

研究工具

在研究工具中,輸入您的關鍵字,MarketMuse 將確定該關鍵字的主要主題:

MarketMuse research tool

主題出現在左側列中。 在右側欄中,您將看到每個相關主題的估計搜索量,以及顯示該主題搜索趨勢的圖表。

最右側的列顯示了您應該在內容中提及該相關主題的建議次數。 MarketMuse 為此使用了顏色代碼:

  • 黃色 = 1 到 2 次提及
  • 綠色 = 3 到 10 次提及
  • 藍色 = 10+ 次提及

您可以通過單擊主題深入了解每個相關主題。 您將看到該主題的變體列表:

MarketMuse research tool

在您的內容中包含這些變體將幫助您對多個關鍵字進行排名。 它還將增加您文章的主題權威,因為搜索引擎現在知道某些單詞一起出現在深入涵蓋某個主題的內容中。

競爭工具

Compete 工具通過分析數千個文檔來創建主題模型。 然後,它根據該模型分析前 20 個結果,並將結果顯示為熱圖。

競爭用於評估和分析給定主題的競爭,並就您希望對該主題的覆蓋範圍做出決定。

Compete 的熱圖可幫助您快速了解比賽如何接近您想要撰寫的主題,您需要包含哪些相關主題,以及您應該涵蓋哪些主題以使您的內容脫穎而出:

marketMuse compete tool

在競爭屏幕的頂部,您將看到該主題的前 20 個搜索結果。 每個搜索結果下方是該文章的 MarketMuse 內容分數。 這是由 MarketMuse 開發的專有分數,顯示頁面涵蓋主題的程度。

熱圖上的顏色代碼向您展示了每條內容對主題的覆蓋程度:

  • 紅色 = 0 次提及
  • 黃色 = 1-2 次提及
  • 綠色 = 3-10 次提及
  • 藍色 = 10+ 次提及

評估頁面覆蓋主題的快速方法是垂直向下掃描一列:

use MarketMuse to check the topical authority of competing content

同樣,您可以通過水平掃描一行來查看比賽如何涵蓋特定主題:

MarketMuse compete tool

在競爭工具中尋找的另一件事是內容分數。 這些使您可以一目了然地看到排名靠前的內容對該主題的覆蓋程度:

using content scores in MarketMuse

如果分數較低,則表明您很有可能通過經過充分研究的內容獲得該主題的高排名。

在競爭屏幕的左側,您將看到構成主題模型的所有主題。

使用競爭工具時,有兩件事需要尋找:必備主題和主題空白。

必備主題是在搜索結果中排名靠前的頁面中始終存在的主題。 為了表現出色,這些主題必須包含在您的作品中。

主題空白是競賽未涵蓋的主題。 它們是通過包含競爭對手缺少的主題來優化您的內容的絕佳機會。

優化工具

優化工具是一個文本編輯器,可以為您提供有關您的內容涵蓋某個主題的程度的實時反饋。 只需輸入您的關鍵字和文章的 URL,MarketMuse 就會顯示

MarketMuse optimize tool

右側面板中的顏色代碼顯示您使用該術語的次數以及您應該使用該術語的次數。

當您向內容片段添加建議的術語時,顏色代碼將更新以表明您正在接近該術語的最佳提及次數。

當您向下滾動頁面時,“Feed”選項卡可讓您對您的內容解決主題的效果進行持續評估:

using the MarketMuse optimize tool

在競爭屏幕的頂部,您會看到一個狀態欄,告訴您您的內容分數、平均分數、目標分數、字數、平均字數和目標字數:

MarketMuse word count and status bar

問題工具

當您處於撰寫文章的研究階段時,MarketMuse 中的問題工具非常有用。 它向您顯示與您的主題相關的最常見問題:

MarketMuse questions tool

在您的內容中包含相關問題是提高文章主題權威的另一種方式。

在屏幕的右側,您會看到一個帶有“Run in”按鈕的列。 這使您可以選擇在其他四個工具之一中運行每個問題:

MarketMuse questions tool

MarketMuse 是一個強大的工具,用於分析主題並確保您的作品內容涵蓋盡可能多的主題。 MarketMuse 之所以特別有用,是因為它基於該特定關鍵字的排名靠前的結果。

它不僅向您顯示排名在搜索結果頂部的頁面涵蓋了哪些主題。 它還向您顯示主題空白。 通過解決主題空白,您可以使您的內容從其他頁面中脫穎而出。

文章見解

Article Insights 是另一個主題建模工具。

它可以幫助您識別出現在特定主題的前 10 個搜索結果中的關鍵字。 它通過將您的內容與競爭對手的內容進行比較來幫助進行競爭對手分析,這樣您就可以看到他們使用了哪些關鍵字而您沒有使用。 它通過將關鍵字標記為人、產品、公司或地點來幫助進行實體檢測。

您需要在 Article Insights 中做的第一件事是創建一個項目。 為您的項目命名,然後添加您要定位的關鍵字:

Article Insights topic modeling tool

然後關鍵字進入處理隊列 - 完成分析可能需要幾分鐘。

處理完關鍵字後,您需要單擊“查看”按鈕。

然後,您將看到一個由兩部分組成的屏幕:左側的書寫界面和右側的分析:

Article Insights AI content tool

在文章編輯器中,您有兩個選項卡:“文章”和“摘要”:

Article and Brief buttons

簡介是您可以留下有關文章的註釋的地方。 有一個分享按鈕,您可以在其中獲得與您的作者分享文章的鏈接。

右側是一個面板,其中包含您內容的所有分析:

這些包括:

  • 字數
  • 您在文章中使用的關鍵字
  • 您的競爭對手使用過的關鍵字(差距分析)
  • 您使用的標題和競爭對手使用的標題數量。
  • 您的內容的獨特性
  • 可讀性分數

您可以從頭開始編寫文章,也可以從 URL 導入正在編寫的文章:

Article Insights import content

在文章編輯器中加載內容後,該工具會根據該關鍵字的前 10 個搜索結果分析您的內容:

Article Insights Score tab
  • 面板 1 和 2向您展示了您的文章的完整性以及您應該瞄準的字數。
  • 面板 3顯示您的內容中使用的前 15 個關鍵字。
  • 面板 4向您展示了您的競爭對手使用的關鍵字以及您使用了多少。
  • 面板 5顯示您使用的標題,並將它們與競爭對手使用的標題進行比較。

標題面板下方是一個顯示“獨特性”分數的面板和一個為您提供 Flesch 閱讀分數的工具:

Article Insights unique content tool

“獨特性”工具包含一個名為“文章重寫”的按鈕。

單擊它會打開文章編輯器,其中包含有用的同義詞建議,您可以使用它來重寫您從“研究”選項卡添加的片段。 將光標懸停在任何突出顯示的單詞上,該工具會為您提供該單詞的替代同義詞:

Article Insights re-writer tool

這非常有用,可以幫助您快速重寫您的內容。

右側面板的頂部是七個選項卡。 到目前為止,我們一直在使用“分數”選項卡。

如果您單擊競爭對手選項卡,您將看到該關鍵字的前 10 名競爭對手的列表,以及每個競爭對手的關鍵字分組。 這些關鍵字分組顯示每個競爭對手使用的熱門關鍵字:

Article Insights competitors tab

您可以選擇和取消選擇競爭對手,這在您認為與您的內容不相關的結果時很有用。

下一個標籤是“研究”。 此選項卡從排名靠前的內容中提取片段:

Article Insights research tab

單擊一個研究片段,它將被添加到文章編輯器中。 然後,您需要重新編寫它以使其成為您自己內容的一部分。

下一個標籤是“標題”。 此選項卡顯示用於您選擇的每個競爭對手的標題。 您可以準確地看到他們的頁面上有多少標題,以及標題的級別。

Article Insights headings tab

接下來是“問題”選項卡。

此選項卡從 Google 中提取與您的主要關鍵字相關的問題。 這些是您可以添加到文章中以獲得主題權威的子主題:

Article Insights questions tab

下一個選項卡是“主題”。 此工具向您顯示相關的關鍵字,按主題分組。 與這些主題匹配的段落將放置在該主題面板中:

Article Insights topics tab

主題大綱可幫助您發現可以輕鬆添加到段落中的相關關鍵字。 將這些相關詞添加到您的段落中將增加您內容的主題權威,並大大提高您文章的質量。

最後一個選項卡是“重複項”。 此工具可檢測您的內容中重複的片段。 您需要重寫此工具標記為紅色的任何內容。

現在讓我們回到“分數”標籤中的關鍵字面板,因為它有一個有用的功能。 單擊該面板中的關鍵字:

Article Insights

然後,該關鍵字將在“競爭對手”選項卡中突出顯示。 然後,您可以查看您的競爭對手使用該關鍵字的次數:

Article Insights

相同的關鍵字也將在“研究”選項卡中突出顯示:

Article Insights research tab

當您嘗試針對特定關鍵字優化內容時,這是一個有用的功能。

結論

隨著算法不再關注關鍵字並嘗試理解主題,您的內容全面涵蓋主題變得越來越重要。

這正在成為在搜索結果頂部排名的關鍵。

在本文中,我們研究了搜索引擎現在使用的各種主題建模技術,以更好地理解單詞在文檔和一組文檔中的共現。

我們已經看到搜索引擎如何使用文檔中相似關鍵字的出現、頻率和接近度來理解主題。

理所當然地,如果搜索引擎使用這些工具來理解主題權威,內容創建者需要使用相同的技術來確保他們的內容正確地涵蓋一個主題。

這就是 MarketMuse 和 Article Insights 等工具的用武之地。它們使用 AI 來分析您正在撰寫的主題,並向您展示該主題中的子主題是什麼,以及您應該使用哪些關鍵字來對該主題進行良好排名。

相關資源

  • 主題集群和 SEO – 構建內容中心的 5 個簡單技巧
  • 語義 SEO - 初學者指南
  • 通過 5 個簡單的步驟在您的網站上創建筒倉結構
  • 什麼是潛在語義索引:7 個重要事實
  • 什麼是 LSI 關鍵字以及如何使用它們來排名更高