段落索引:來自 Google 的新排名算法
已發表: 2022-05-09從 2021 年開始,您的 Google 搜索體驗將煥然一新,因為這家搜索引擎巨頭推出了一個排名因素——段落索引。
新排名技術於 2021 年 2 月 11 日正式推出。正式推出的確認來自 Google SearchLiason 推特賬號:
更新:太平洋時間昨天下午推出的段落排名,用於在美國用英語進行查詢。 它會在不久的將來出現在更多的英語國家,然後是其他國家和語言。 隨著進一步的發布,我們將更新此線程。
— Google SearchLiaison (@searchliaison) 2021 年 2 月 11 日
[推廣橫幅=“3”]
什麼是段落索引算法?
段落索引是谷歌算法使用的一項新技術,它可以根據用戶的搜索查詢對搜索結果頁面內的單個段落進行排名。
還記得谷歌在 2019 年 9 月發布的關於 BERT 的公告嗎? 他們說 BERT 將影響 10% 的英語搜索查詢。 現在,不管你信不信,它實際上影響了超過 99% 的查詢。
段落索引將對搜索結果頁面產生類似的連鎖反應,因為 Google Crawlers 將開始了解您內容中特定段落的相關性。
雖然它被稱為 Passage Indexing,但在 Google 當前的索引過程中並沒有發生重大變化。 然而,新技術更多地與排名有關。
所以,這字面意思是,如果你有關於站外 SEO 的長篇內容,並且你有關於每個站外 SEO 策略的單獨段落,谷歌現在將對與搜索查詢匹配的內容的各個部分進行排名.
自成立以來,Google 一直在朝著提高搜索結果相關性和上下文的方向發展。 您現在可以看到,兩個核心排名因素——內容和鏈接——只有在補充相關性時才有價值。
谷歌關於 Passage Index 的官方公告稱,搜索算法現在可以最精細地理解頁面內內容的相關性。
這意味著即使與搜索查詢相關的答案深藏在頁面中,Google 也可以為您挑選特定的段落。 這家搜索巨頭表示,它現在能夠找到“你正在尋找的大海撈針信息”。
Passage Index 將影響全球 7% 的搜索查詢。 既然我們面前有 BERT 的例子,這個百分比肯定會在一年的時間內達到指數水平。
段落索引側重於排名不顯示
讓我讓您輕鬆理解段落索引的概念。
首先,段落索引與 Google 將在哪裡顯示結果無關。 這是一個額外的排名因素,使 Google 能夠理解頁面中的各個段落。
段落排名與展示無關。 它不會導致片段以某種方式變長。 這是關於通過了解文本段落的上下文來更好地理解頁面的內容,它們可以在哪裡被識別,*除了*其他排名因素。
- 丹尼沙利文 (@dannysullivan) 2020 年 12 月 29 日
因此,這意味著段落索引將就像 BERT 或鏈接分析算法一樣。 它與其他排名因素協同工作,為用戶帶來更好的結果,而不會對 SERP 的整體外觀和感覺做出太大改變。
關於段落索引的混亂是由於谷歌的一個壞例子造成的,丹尼沙利文在他的一條推文中證實了這一點。
這是一個糟糕的插圖,因為它將常規片段與特色片段進行了比較。 任何現在成為精選片段的常規列表 - 沒有段落排名 - 看起來像這樣。
- 丹尼沙利文 (@dannysullivan) 2020 年 12 月 29 日
這是一個有趣的示例,可以了解段落索引算法的工作原理:
考慮您想要將其列為具有多個章節的書的頁面。 到目前為止,谷歌過去常常根據您所涵蓋的主要主題對這本書進行排名。
但是通過段落索引,Google 可以理解您書中的各個章節。 因此,這意味著當在搜索中輸入高度相關的查詢時,您的各個章節(頁面的部分)將顯示在結果中。
這意味著您現在不需要做任何事情來使您的頁面通道索引友好,因為它更多的是內部排名變化。
但是,結構化您的內容可能會使 Google 的段落索引算法更容易更好地理解文本的含義。
因此,如果您是編寫具有多個子標題的長篇內容的人,並且您沒有看到這些文章的有機吸引力,那麼段落索引是一個福音。
早些時候,具有精細內容的頁面無法排名,因為主要主題可能很廣泛。
但是通過段落索引,這種長格式頁面現在可以針對上下文相關的相關查詢進行排名。
因此,如果您正在運行電子商務網站,您的產品頁面可能無法從段落索引中受益,因為內容通常是重點。
段落索引算法如何工作?
段落索引不會改變抓取和索引過程,但它會幫助 Google 理解頁面中段落的含義。
這意味著谷歌將不會獨立索引個別段落。 每當輸入查詢時,Google 將根據相關性和含義在結果中顯示最合適的段落。
如果您對基於長尾問題的搜索查詢進行快速 Google 搜索,您最終可能會看到包含網站列表的結果。 但是您想要的是對您的問題的具體答案,而 Google 以前無法提供。
但是,通過段落索引算法,Google 搜索將為您獲取與您的查詢最相關的答案。

有趣的是,為您提供答案的頁面可能包含長篇內容,但 Google 只是通過向您顯示與上下文最相關的答案來節省您的時間。
以下是 Google 關於段落索引的官方說法:
因此,例如,假設您搜索非常利基的內容,例如“我如何確定我的房屋窗戶是否是紫外線玻璃”。 這是一個非常棘手的問題,我們有很多網頁都在談論 UV 玻璃以及如何需要特殊膠片,但這些都不能真正幫助外行採取行動。 我們的新算法可以直接放大回答問題的 DIY 論壇上的這一段落。 顯然,您可以使用火焰的反射來判斷和忽略頁面上其他不太有用的帖子。
谷歌只是要索引部分頁面嗎?
谷歌官方已經確認 Passage Index 不會取代正常的頁面索引。 這意味著谷歌的爬蟲將繼續完全索引頁面,但在這樣做時,它會嘗試理解內容和內容中每個段落的含義。
這並不意味著谷歌索引頁面的方式發生了變化。 儘管如此,它還是在現有流程中添加了另一層,這當然會改變頁面的排名。
就 SEO 而言,這很重要,因為通道索引算法將帶來排名和結果顯示方式的範式轉變,而不是索引更改。
精選片段和段落索引之間的區別
根據 Google 的說法,精選片段結果是來自具有整體主題相關性的頁面的段落。
但是,段落索引不考慮頁面的整體相關性,而只考慮段落與搜索查詢的相關性。
谷歌的丹尼沙利文也在推特上發表了同樣的言論,“精選片段用於語音搜索。 它們已經使用不同於段落的系統來識別。”
精選片段用於語音搜索。 它們已經使用與段落不同的系統來識別。
- 丹尼沙利文 (@dannysullivan) 2020 年 10 月 21 日
Google 是否使用 SMITH 語言處理進行段落索引?
我們聽說 BERT 能夠理解搜索和單個頁面中的長查詢。 但現在,谷歌似乎釋放了一種巨齒鯊,它的代號為 SMITH。
SMITH 代表 Siamese Multi-depth Transformer-based Hierarchical (SMITH) Encoder,這是一項已申請的新自然語言處理專利。
這種新的語言處理模型旨在讓 Google 算法理解頁面中的段落。
所以,現在我們知道了谷歌在不久的將來如何使用通道索引的路線圖。
在 Google 關於 SMITH 的文檔共享中,它說,語言處理系統將有助於推薦新聞文章、相關文章,以及重要的聚類文檔。
關於文檔聚類的第三點是一個重要方面,因為它與段落索引直接相關。
它還說,SMITH 是一個長篇文檔匹配系統,它再次指向 Google 發布的 Search On 公告以及 Danny Sullivan 的推文,即長篇內容將如何從 Passage Indexing 中受益。
它的工作原理與 BERT 幾乎相似。 雖然 BERT 使用掩碼詞語言建模,但 SMITH 通過掩碼句子塊來提升這一點。
根據谷歌的說法,他們“在長篇文檔匹配的幾個基準數據集上的實驗結果表明,我們提出的 SMITH 模型優於以前的最先進模型,包括分層注意力、基於多深度注意力的分層遞歸神經網絡、和 BERT。”
當您將 SMITH 與 BERT 進行比較時,前者俱有處理更多單詞的能力,據 Google 稱,這有助於提高匹配文檔的能力。
“與基於 BERT 的基線相比,我們的模型能夠將最大輸入文本長度從 512 增加到 2048,”谷歌專利說。 需要注意的是,BERT 的最大輸入文本長度為 512 個單詞。
這就是史密斯付諸行動的方式:
步驟 1:將文檔拆分為多個句子塊
第 2 步:語言處理 Transformers 將學習每個句子塊的上下文表示。
第 3 步:然後按照 BERT 中的做法,在上下文中表示整個句子塊。
第 4 步:給定一系列句子塊表示,文檔級 Transformer 學習每個句子塊的上下文表示和最終文檔表示。
猜測:我們是否正在進入內容優化 2.0?
Passage Indexing 將改變 Google 顯示搜索結果的方式,在未來的日子裡,SEO 似乎還有很多工作要做。
谷歌認為元標題和標題標籤是理解內容上下文的基本信號。 但那是在他們推出 Passage Indexing 之前。
通過段落索引,谷歌已經開始通過獨立理解段落的含義來索引頁面。 因此,各個段落現在可以針對相關搜索查詢進行排名。
更有趣的是,即使頁面討論了一個不太相關的主題,如果用戶查詢的答案隱藏在任何段落中,該頁面也會出現在搜索中。
查看與 Google 員工有關 Passage Indexing 的各種討論,顯然 Passage Indexing 將產生更大的影響。
例如,在辦公時間的討論中,John Mueller,後者說,段落索引的結果現在可能會出現在特色片段區域中,但隨著時間的推移,段落索引將決定正常的搜索結果。
約翰說:
所以可能是我們首先在特色片段中展示這些,因為我不知道我們展示了那個例子,或者這可能是我們可以檢查這個的最清晰的方法。 然後在某個時候,我們也開始在正常搜索結果中更多地顯示它們。
這是一個重要的聲明,因為我們知道 Google 很長一段時間以來一直在淡化元描述,並且通道索引很有可能會控制未來元描述中出現的內容。
除此之外,我個人認為元描述的字符限制不會增加以容納整個段落。 相反,谷歌可能會做的是將滾動到已經在特色片段結果上實現的文本功能擴展到元描述。
這樣,用戶可以導航到頁面中回答他們問題的確切段落。 但是,如果您依賴廣告收入,那麼此功能將對您的收入產生重大影響,因為用戶將
我認為這很快就會成為現實的另一個原因是,谷歌有在大規模推出之前對 SERP 功能進行小規模測試的歷史。
當前段落索引結果代替特色片段和滾動到文本功能的示例可以被吹捧為分析的一部分,以了解它們對用戶有多大用處。
John 對 Glenn Gabe 關於段落索引是否只會為精選片段提供更好的答案的問題的回答本身就揭示了段落索引對 Google 的重要性。
以下是約翰的回答:
所以我有點退後一步,只是用我的內部信息猜測這個。 通常情況下,我們會在一個特定的地方推出它們,進行一些試驗以找出如何最好地實現這些,它們如何最好地工作,然後找到更廣泛地推出的方法。
但又有點像搜索中的所有這些新變化。 通常,我們會在小範圍內嘗試它們,然後隨著時間的推移將它們擴大一點。
即使 Google 是否將段落索引限制在精選片段區域,您也可能會發現零點擊查詢的數量有所增加。
發生這種情況是因為用戶在 SERP 上獲得了最佳的上下文相關信息,並且他們無需訪問已策劃內容的網站。
因此,一旦段落索引上線,請密切關注您收到的印象和點擊。 此外,Search Console 很有可能會為段落索引添加增強功能並展示新功能產生的點擊。
這也意味著搜索引擎優化現在可以停止關注關鍵字,並為主題相關性和結論性提供更多動力。
在推出 Passage Index 後,了解用戶的擔憂並通過內容解決方案解決這些問題將對網站的成功發揮重要作用。
我的意思是,對一個特定主題採取整體方法的長篇內容有機會從新的段落索引算法中受益。
多虧了谷歌的自然語言處理算法——BERT,理解每個段落的含義和相關性對於這家搜索引擎巨頭來說不再是一項麻煩的任務。
有時,如果您查看 Google 提出的算法和功能,您會看到它們工作方式的同步性,以及它們如何支持實現 Google 的原始目標,即為給定的搜索查詢為用戶提供最佳結果。
[推廣橫幅=“4”]