什麼是 BERT SEO 和自然語言處理?
已發表: 2020-02-12由於 BERT,自然語言處理 (NLP) 是每個移動 SEO 活動中必不可少的新要素。
您可能聽說過“言出必行”這句諺語。 同樣,在搜索營銷中,我們如何在頁面上使用單詞也很重要。 Google 的 BERT 提供了有關其搜索結果組織的見解。 它說明了單詞實體和語言使用之間的關係如何塑造 SEO 的未來。
移動優先索引會影響 Google 對搜索者的物理(GPS / Google 地圖)位置的依賴性增加。 它還知道搜索者在手機和 Google 帳戶中的語言設置。 這有助於通知返回的搜索結果並提供更個性化的搜索結果。
谷歌一發布聲明,宣布 BERT 算法影響搜索格式,我們就知道這值得時間和關注。 由於它旨在改進對複雜長尾搜索查詢的解釋並顯示更多相關的搜索結果,這是 5 年來最大的搜索更新。 只有將 BERT 所包含的詞的實際含義內化後,我們才能更好地進行搜索營銷。
這是我們今天所達到的。
什麼是 BERT?
BERT,是來自 Transformers 的雙向編碼器表示的首字母縮寫詞。 它是一種基於神經網絡的自然語言處理預訓練技術。 簡單來說,它可以用來幫助搜索引擎更好地破譯搜索查詢中單詞的上下文。
BERT 模型超越了以前的能力。 他們通過查看單詞前後的兩個單詞來評估單詞的完整上下文。 這有助於它收集對於理解提示搜索查詢的意圖特別有用的上下文。
什麼是 Google 實體?
谷歌於 2016 年 10 月 25 日獲得專利號為 US 9,477,759 B2 的專利。它將谷歌實體定義為:“單一、獨特、明確定義和可區分的事物或概念。” 它還解決了依賴於非結構化數據中的實體引用的問答能力。 該專利解釋了谷歌如何在網頁中找到相關信息。
重要的是要了解實體不一定是物理對象,它也可以是色調、日期、香味等。 實體是任何事物:單一的。 例如,實體可以是個體、物理建築、地理位置、產品項目、聲音、認知想法、抽象概念、事實元素或其他存在的事物。 它也可以是這些的任意組合,以幫助 Google 如何抓取網站並將其編入索引。
實體不屬於父節點; 相反,它的後代是只讀的。 實體的名稱保存在nodeName
屬性中。 此外,Entity 是一個 Node 對象,因此繼承了它的一些屬性和方法。
什麼是實體識別?
實體識別是將搜索從字符串提升到事物的原因。 它幫助 Google Search Appliance 識別和分類文檔中感興趣的實體,然後將這些實體存儲在其庫或搜索索引中。 SEO 可以豐富元數據貧乏的內容,從而增加使用 NLP 通過文本贏得豐富結果的機會。 術語可以是實體的名稱,之後稱為“命名實體”。
什麼是實體查詢匹配?
實體查詢匹配擴展了 Google 先進的內容感知能力。 如何在現場優化中使用 NLP 已成為 2020 年的首要問題。從廣泛的市場調研開始每一次內容營銷活動。 這將幫助您了解搜索引擎可能與每個主題的用戶查詢相關聯的上下文。
如何知道哪些頁面足夠可信,可以看到 NLP 優化的結果?
如果您已經擁有有關某個主題的優質內容並對其進行排名,那麼您就有更好的機會。 找到一個內容薄弱但可能由於入站鏈接而排名的頁面,然後從改進這些頁面開始。 如果用自然語言編寫,您的內容將更好地滿足真實觀眾的需求。
什麼是基於上下文的自然語言處理?
基於上下文的自然語言處理從搜索引擎如何嘗試識別可用於匹配特定用戶請求的上下文開始。 它涉及通過利用依賴於上下文的對話系統引擎來處理此類用戶請求。 這些通常引用語音上下文,這些語音上下文源自一系列用戶請求或對話系統答案,這些答案被存儲和分類
搜索營銷人員如何使用 NLP 來增加收入?
結構化數據反映了您的內容是關於什麼的。 如果它被正確實施並保持最新,它應該這樣做。 對於電子商務網站,包括可以回答具有購買意圖的搜索查詢的上下文內容。 避免使用可能具有負面含義的 NLP 實體,例如“沮喪”或“瘋狂”。 它需要有大局而不是價值觀本身。 這將有助於破譯實體中的細微差異。
搜索結果頁面,稱為 SERP,非常受歡迎。 正確的內容可以幫助您的業務在 Google 的本地包和精選片段等功能中脫穎而出。 通過採用以 BERT 為中心的思維方式,您的企業甚至可以通過零點擊搜索贏得客戶的來電。 在您的內容髮布工作流程中添加語義處理涉及使用自然語言處理來添加描述您的內容的有用的語義結構化信息。 許多搜索策略可以包括 NLP 以提高 SEO 和用戶參與度。
自然語言處理領域正在飛速發展。 結合機器學習並在深度學習技術的驅動下,出現了單詞使用模式。 實體和節點從大量文本中生成內容結構。 然後谷歌選擇它想要的方式來使用它們。
谷歌知識圖顯示相關實體。 廣為人知的人的知識面板可能會顯示適合您的搜索查詢的該人與另一個人之間的聯繫。 通過單擊“查看連接”,將填充包括兩個人在內的更多信息。 要自己進行實驗,請搜索您最喜歡的名人,然後在“人們也在搜索”SERP 結果中選擇建議的名人。 這是觸發這些相關實體節點的一種方式。
會話式 AI 聊天機器人和語音助手依靠最先進的自然語言模型在業務不可用時回答人們的問題。 可以對這些模型進行訓練,以促進以消費者為中心的方法來回答常見問題。
每個企業都需要關心 Google 搜索實體嗎?
是的,那些想要在自然搜索中找到的人。 您如何在內容中使用實體的目標應該包括激勵人們採取與您的業務目標直接相關的行動。
準確代表您的企業名稱和實體有助於客戶在線找到您的企業。 首先是一個完全優化的 Google 我的商家列表,其中填寫了所有實體。
他們可能永遠不會這樣想。 您手機上的麥克風始終在監聽。 在後台,機器學習正在評估它從接收到的實體中聽到的信息。 最新版本的 iPhone 和 Android 會顯示到它最後聽到你說話的地方的距離。 或者在哪裡看到它最後聽到的在您收聽的廣播/電視廣告中宣布的電影。 它還在聽什麼?
安裝在我電腦上的 Cortana 最近多次對我說:“如果我能熟悉你說話的方式,我就能更好地理解你。” 然而,我並沒有和它說話,也沒有認為它在“聽”。
在過去的幾個月裡,我們看到越來越多的證據表明,谷歌的移動優先索引不僅是對主要爬蟲的改變,而且是谷歌組織信息和處理查詢的戰略的重大轉變。 移動優先索引中的語言和實體之間的關係,‘實體優先索引’,怎麼強調都不為過。” – Mobile Moxie 的 Cindy Krum
在內容中使用單詞和短語的最佳方式是什麼?
內容中的單詞變成實體對。
Web 內容中的單詞應該以與人們說話的方式相同的方式流動,但它需要在 BERT 所尋找的術語中在語義上是正確的。 這將幫助您在 SERP 中獲得最全面的結果。
尋找與您的頭部搜索短語最相關的單個實體。 檢查如何正確使用實體為讀者添加上下文價值。 目前谷歌擁有最好的數據集來幫助算法學習。
以前缺乏商業頭腦的 SEO 現在被迫了解商業策略並擁有全面的數字營銷技能。 您的內容和通信中使用的單詞或搜索短語很重要。 每一句話都應該是有用的和重要的。
自然語言處理模型的重要性
為什麼要使用 NLP API 處理器來改進實體查詢匹配?
轉向更自然的語言方法的好處基本上有兩個。
- 它使您的內容更易於人們閱讀和採取行動。
- 它使搜索引擎更容易理解和編目您的內容。
回到在非結構化數據專利中使用實體引用回答問題。 它告訴我們,實體基本上就是人們在 Google 上搜索的內容。 擁抱 NLP 對於電子商務網站來說意義重大。 實施和測試您的產品標記,以幫助以預定義的方式組織您的登錄頁面。
考慮上述專利所述:
考慮上述專利所述:
“基於相應的加權和對一個或多個實體引用進行排名:至少部分基於一個或多個實體引用的排名,從一個或多個實體中選擇一個實體結果到引用; 並至少部分基於實體結果為查詢提供答案。”
Google 助理如何使用自然語言處理
另一項谷歌專利更側重於處理移動會話搜索查詢。
谷歌助手是一個人工智能驅動的虛擬助手,可以與搜索者進行個性化對話。 在正確響應會話搜索查詢方面,它的表現優於其他所有。 它部分依賴於先前搜索會話的上下文。
2019 年 11 月 19 日授予的一項更新的 Google 專利更直接地與 Google Assistant 有關。 它的標題是基於上下文的自然語言處理,並向我們介紹了涉及用戶請求的多模態處理的自然語言處理 (NLP) 方法。 與他們正在使用 BERT 更有效地理解自然語言的公告相吻合。
當面臨“單獨或孤立地處理都無法合理理解”的查詢請求時,這家技術巨頭正在尋求克服挑戰。 Pandu Nayak Google 研究員兼搜索副總裁於 2019 年 10 月 25 日發表了一篇題為“比以往更好地理解搜索”的文章。 他說,“我們每天都會看到數十億次搜索,其中 15% 的查詢是我們以前從未見過的——因此我們建立了一些方法來為我們無法預料的查詢返回結果”。
使用 BERT 算法,即使是小詞現在也可以幫助更好地理解搜索意圖。
“‘to’這個詞及其與查詢中其他詞的關係對於理解其含義特別重要。 這是關於一個巴西人去美國旅行的故事,而不是相反。 以前,我們的算法無法理解這種聯繫的重要性,並且我們返回了有關美國公民前往巴西的結果。 借助 BERT,Search 能夠掌握這種細微差別,並知道非常常見的單詞“to”在這裡實際上很重要,我們可以為這個查詢提供更相關的結果。” - 谷歌
BERT 提供對單詞和語言的更好理解
“語言理解是我們在搜索方面所做的一切的關鍵,”Pandu Nayak 說。 “這是我們在過去五年中發生的唯一、最大、最積極的變化。”
Google 可以通過識別與用戶搜索相關的語音類型、實體節點或環境上下文來更好地解讀用戶請求。 您可以使用這些實體見解來展示您的行業利基專業知識。 該專利引用了“對話系統”和移動應用程序。
“傳統的對話系統廣泛用於信息技術行業,尤其是以無線電話和平板電腦的移動應用程序的形式。 通常,對話系統是指基於計算機的代理,它具有以人為中心的界面,用於訪問、處理、管理和傳遞信息。 對話系統也稱為聊天信息系統、口語對話系統、對話代理、聊天機器人、聊天機器人、聊天機器人、聊天代理、數字個人助理、自動在線助理等。” – 專利 US20160259775A1
現在這是屬於“對話系統”的通信實體的綜合列表! 該專利解釋了 Google Assistant 是如何設計為通過 NLP 與搜索者聯繫的。
“對話系統以自然語言與其用戶交互,以模擬智能對話並為用戶提供個性化幫助。 例如,用戶可能會以會話問題的形式向對話系統生成請求,例如“最近的酒店在哪裡?” 或“亞歷山大的天氣怎麼樣?”,並以音頻和/或可顯示消息的形式從對話系統接收相應的答案。 用戶還可以向對話系統提供語音命令…… – 專利 US20160259775A1

既然我們已經基本掌握了 Google 搜索如何使用 NLP,那麼這將如何影響我們的內容創建和 SEO 方法是令人著迷的。
提高網站自然語言處理能力的 7 種 SEO 策略
NLP 有多種方式用於提高 SEO 和用戶參與度。
1.確保您的網站和內容與主題相關
2.關注語義內容
3. 在內容連接中使用本體分類和相關性
4. 使用 Google AutoML 使企業能夠查找實體
5.更新滯後或過時的舊帖子
6. 為依賴語音激活搜索的搜索者做計劃
7.願意嘗試結構化數據
現在更深入地了解 Hill Web Marketing 將自然語言處理與語義網絡技術和機器學習結合使用的方式。 通過這種方式,我們為電子商務銷售獲得了真正的 SEO 優勢。
1.確保您的網站和內容與主題相關
奇怪的是,許多網站在沒有明確關注特定主題的情況下胡言亂語。 如果您想銷售“醫療器械創新”,請確保您的網站與“醫療器械”主題以及所有相關且有用的內容相關。
高分網頁不僅僅是提供銷售副本或直接回答問題。 它們還包含支持信息。 很多時候,一個答案會引發讀者的另一個問題。 提供相關答案並預測他們的需求。 包括您知道他們將需要的信息 - 並且以前沒有想到過。
谷歌希望在網絡上提供解決方案; 即易於讀者理解的“正確且相關的解決方案”。 結合結構化數據標記的結構化內容創建方法將大有幫助。
如果您在內容中提供這些需求答案和解決方案,您可以期待您的域的權威增長。 它還增加了您獲得 Google Rich Card 的機會。
2.關注語義內容
語義知識映射以類別顯示彼此相關的單詞。
當前的谷歌算法更多地依賴上下文語言而不是逐字關鍵字。 自最近的算法更新以來,它專注於搜索者查詢的整個上下文。 通過成為正確問題的最佳答案,您的企業將提供最大的價值。 您可以在此處添加常見問題架構,這是架構標記的基本類型。
檢查您的內容長度以匹配您的搜索者的意圖。 深入的信息內容可以滿足一種需求,而快速的答案可以滿足另一種需求。
通過對您的自然語言內容和內容結構進行語義分析,您可以找到內容中能夠捕捉文本真正含義的所有單詞。 現在,您可以進一步確定將哪些文本元素分配給它們的邏輯和語法角色。 通過這種方式,您可以在文本中與 BERT 一致的不同概念之間建立關係。
2019 年 8 月 8 日的基於 BERT 的語義知識匹配用於調度故障處置信息一文揭示了 BERT 模型的龐大性。 Jixiang Lu 和 Tao Zhang 表示“Bert 是基於海量 Wikipedia 數據(25 億字)和 BookCorpus 數據(8 億字)的預訓練模型”。
它能夠獲得上下文單詞表示。 舉個例子,考慮一下谷歌地圖上的所有內容。 它使用可能具有與其關聯的多個屬性的真實世界實體。
3. 在內容連接中使用本體分類和相關性
獲獎內容也非常簡潔,由權威來源撰寫的更多事實性內容。 它也很吸引人。 當人們能夠迅速在情感上與您的信息產生聯繫時,他們就會更可愛。 專注於解決更深層次的人類問題。 SEO 可以採用人工智能來改善用戶體驗並提供措辭清晰的解決方案。 B2B 內容還需要引人注目的轉換觸發器和智能 UX 設計。
谷歌投資於建立一個基於知識的概念庫。 這有助於這家技術巨頭更好地了解不同的企業或實體“知名”等事物,或定義實體之間更好的聯繫關係。 當用戶參與歷史表明搜索意圖可能在查詢中包括該實體時,特定實體的網頁可能會在搜索結果中獲得最高位置。
您的搜索策略可能需要同時包含自然搜索和付費廣告,以吸引數字購物者。
4. 使用 Google AutoML 使企業能夠查找實體
我們自己檢查一下。 谷歌告訴我們 AutoML 自然語言是如何工作的。
1. 上傳您的文件。 根據您的域特定關鍵字和短語標記文本。
2. 訓練您的自定義模型。 分類、提取和檢測情緒。
3. 評估。 獲取與您的特定需求相關的見解。
Google 的 Natural Language API 可識別文本中的語法、實體和情感,並將文本組織成一組預定義的類別。 用於新聞文章、學術內容或揭示示例情感的內容可能會發現自然語言 API 值得嘗試。 此外,我們喜歡通過使用自定義分類器來使用我們自己的標籤。
5.更新滯後或過時的舊帖子
很少有讀者消費過的現有“傳統 SEO 文案寫作”牆需要瓦解。 知識圖譜、實體和自然語言都是至關重要的。 它們在常青內容中佔有重要地位,同時承認人們如何從書面文本轉向視覺媒體和視頻內容的快速滿足。
純粹的技術作家可能缺乏主題知識或對他們的寫作內容充滿熱情。 這使得用人們容易理解的最佳語氣和詞組選擇變得更加困難。 了解哪些搜索可以通知您編寫更好的內容。
然後,您將需要深入的技術 SEO 審核,以確保沒有阻礙您的內容的故障。
最好的 SEO 內容策略從簡單開始:
- 了解你的技能和激情。
- 知道你的聽眾想要什麼。
- 您使用的實體應該建立您的品牌信任因素。
這是用於從輸出中提取實體的腳本。
6. 為依賴語音激活搜索的搜索者做計劃
許多技術可以為 Google 助理提供支持。 我們可以從谷歌那裡得到關於它使用 BERT 來匹配問題答案的線索。 使用 NLP 支持基於語音模式和環境上下文的更好的上下文搜索。
語音激活搜索是人們發現和購買商品的一種自然方式。 這意味著營銷人員應該調整他們的內容策略和 SEO 工作,以最好地與 Google 搜索的發展方式保持一致。 如果搜索者的思維方式和搜索偏好依賴語音助手應用程序,這會將他們的搜索行為從文本輸入更改為語音輸入。
根據張濤的說法,在微調期間,BERT 的“每個句子的最大序列長度設置為 128,每個序列的最大預測長度設置為 20”。 所以我們可以看到它在哪裡更好地管理更長的搜索短語。 這適合語音激活的搜索查詢,因為它們往往更長,如自然句子。
語音搜索將會增長,特別是對於希望免提、移動方便的廣大移動用戶而言。 他們快速思考並期待高效的用戶體驗。 預見到這種爆炸性的移動搜索趨勢,BERT 處理複雜的自然語言查詢比迄今為止任何東西都要好。
7.願意嘗試結構化數據
雖然Speakable
標記仍處於測試階段,但您可以嘗試。 如果識別出似乎通常是語音激活的Speakable
Schema 標記的重要問題,則可以聽到回答。 與其他 SEO 策略一樣,沒有任何保證。 熟練的搜索營銷人員將通過嘗試、測試和調整工作獲得自己的經驗。 他們可以進行全面的網站審核,以找到改進搜索策略的方法。
谷歌算法更新會影響 SEO 最佳實踐,因此最好靈活并快速學習。
盡可能多地使用適合您的上下文的結構化數據標記。 有多種 SEO 工具可用於提取實體。 這些實體及其唯一標識符可用於幫助向搜索引擎描述您的內容。
搜索引擎試圖了解出現在您的頁面上的實體、它們與其他實體的關係、它們與這些實體的屬性(屬性)的關聯關係以及與這些實體的分類的關係。 您網站的架構、本體和結構化數據都有幫助。
查詢中的命名實體識別 Google 專利號 US9009134B2
它的應用狀態截至今天(2020 年 2 月 11 日)是有效的。它進一步解釋了計算機科學和情感分析中的詞性標註。
什麼是查詢分割?
該專利回答並定義了查詢分割是什麼。 知道它通常是指將特定查詢分割成更小的單元。 它告訴我們“通常可能存在對可能的分段單元類型的限制,導致該方法的功能有限。 句法分析通常側重於識別查詢的語言結構。 查詢分類通常分為兩組:根據搜索意圖進行分類,例如信息性、導航性或事務性; 並根據查詢的語義進行分類。”
這可以應用於“採購”或“買家”。 兩種形式的查詢分類都考慮了整個查詢。 一旦分類,通常不會對查詢的內部結構進行進一步診斷。
我們還詳細了解了它如何在採用無監督學習方法時克服模棱兩可的主題實體和挑戰。
“由於模型中的主題可以預先定義,並且可以給出文檔的可能主題,因此可以採用一種新的學習主題模型的方法,稱為弱監督潛在狄利克雷分配 (WS-LDA)。
對於每個單詞
一種。 繪製主題分配 zn~Multinomial(θ)
灣。 畫出單詞 wn~Multinomial(βZn),一個以主題 zn 為條件的多項式分佈。””
我們了解到,匹配實體的一個數據源可能是“查詢日誌數據,例如來自商業網絡搜索引擎的查詢日誌”或類似的東西。 該專利提供了實施各種實施例以對來自計算機可讀介質的實體進行分類的示例形式。 它提供的部分包括:“RAM、ROM、EEPROM、閃存或其他存儲技術、CD-ROM、數字多功能磁盤 (DVD) 或其他光存儲、磁帶、磁帶、磁盤存儲或其他磁性存儲設備,或任何其他可用於存儲所需信息的介質”。
實體提取的機器翻譯幫助可以在網絡上的開源中找到。 跳入自定義實體建模令人興奮——尤其是因為實體理解有助於我們與真實消費者更好地溝通。 本地業務模式是構建知識圖譜和與本地消費者建立聯繫的基礎。 辛迪克魯姆說得最好,所以,我會再次引用她的話。
“總體而言,實體讓谷歌對主題有了更好、更深入的理解,因為它們讓谷歌能夠輕鬆地在不同主題(實體)之間建立聯繫和關係。 反過來,對實體及其關係的更深入了解使 Google 有機會以任何語言提供有關實體的信息(如有必要,可以從 Google 語言 API 進行實時翻譯),因為現在該語言僅對查詢——就像一個修飾符。 無論 Google 在一種語言中學習到的任何實體理解和實體關係都可以自動翻譯成其他語言,尤其是在 Google 託管的零位置結果中,例如知識圖。”
Google BERT 算法會嘗試在您發布的頁面與其識別的主題之間找到正確的聯繫。 您可以幫助 Google 在您的網站上找到正確的“實體”。
結論:
數據可以作為新的基準。 真正的常識 NLP 技術融合了新技術,如結構化知識模型。
人與人之間的對話可以很容易地理解所提出的問題,以便選擇正確的答案來回應。 身體姿勢、手勢、語氣都清楚地表明了談話的真正內容。 NLP 正在幫助機器更好地做同樣的事情。 隨著我學習和實驗的更多,我將更新這篇文章以使其更有用。 歡迎您使用 NLP 並發表評論。
尋找新方法來豐富您的內容。