學習自然語言處理的 13 門最佳 NLP 課程

已發表: 2022-11-24

這是 NLP 課程和專業的列表,可幫助您開始自然語言處理之旅!

自然語言處理 (NLP)位於計算機科學計算語言學的交叉點。 從客戶評論的情緒分析到推動營銷決策再到機器翻譯和聊天機器人,NLP 正在為所有行業提供動力。

如果您有構建機器學習模型的經驗,則可以將 NLP 添加到您的工具箱中以解決各種問題:文本摘要、問答、自然語言生成等。

我們將查看 NLP 角色的廣泛技能要求,然後繼續查看精選資源列表以開始自然語言處理。

NLP 職業道路:NLP 工程師、NLP 開發人員等

研究的進步推動了現代 NLP 技術的發展。 NLP 工程師和開發人員的平均工資超過 117,000 美元,最近越來越受歡迎。

技能集是多種多樣的,從下游 NLP 任務的數據收集和語言學概念的應用知識,如依賴解析和詞性 (POS) 標記,到轉換器模型的應用知識。

進入NLP,熟練編程和機器學習 是必須的。 您還應該具有深度學習框架(如 PyTorch 和 TensorFlow)以及 NLP 庫(如 spaCy 和 HuggingFace)的經驗。

自然語言處理 (NLP) 課程

接下來,讓我們回顧一下流行學習平台上提供的一些最佳課程。 我們還將說明充分利用這些課程所需的先決條件。

CS224n:具有深度學習的 NLP

CS224n:NLP with Deep Learning 由 Chris Manning 教授授課,斯坦福大學提供,是學習自然語言處理的最佳課程之一。 這些講座可在 YouTube 上找到,課程網站上免費提供當前和以前提供的講義和練習筆記本。

Youtube 視頻

先決條件

  • Python編程
  • 數學:統計、概率、微積分、線性代數
  • 機器學習基礎

這是一門為期一個學期的課程,涵蓋廣泛的 NLP 主題:

  • 詞向量
  • 遞歸神經網絡
  • 注意力和子詞模型
  • 變壓器及應用

定價: 免費

NLP 專業:Coursera

DeepLearning.AI 在 Coursera 上的自然語言處理專業化是一種流行的學習資源。 該專業旨在通過四門課程教授傳統的 NLP 技術以及最新的進展,例如 transformer 和 reformer 模型。

nlp-課程-coursera

先決條件

  • 中級 Python
  • 機器學習和深度學習框架知識
  • 微積分、線性代數、統計學

以下是該專業的課程:

  • 具有分類和向量空間的 NLP
  • 具有概率模型的 NLP
  • 具有序列模型的 NLP
  • 具有註意力模型的 NLP

專業化中的每門課程都需要 30 多個小時才能完成,並且需要幾個月的時間才能完成整個專業化。

以下是您在完成此專業化過程中將構建的一些項目:

  • 文本自動完成模型
  • 使用 BERT 進行問答
  • 文本摘要
  • 使用改革者模型的聊天機器人

TensorFlow 中的自然語言處理:Coursera

如果您已經熟悉 TensorFlow,可以通過 Coursera 上的 DeepLearning.AI 學習 TensorFlow 中的 NLP,使用 TensorFlow 構建 NLP 模型。

nlp-課程-coursera-tf

先決條件

  • Python 和數學
  • TensorFlow 的應用知識

該課程涵蓋以下內容:

  • 使用 TensorFlow API 進行文本標記化和預處理
  • 詞嵌入
  • 自然語言生成

序列模型:Coursera

DeepLearning.AI 在 Coursera 上的深度學習專業課程的序列模型課程旨在讓學習者在 4 週的時間內掌握 NLP 的工作知識。

nlp-課程序列模型

先決條件

  • Python
  • 機器學習和線性代數

該課程涵蓋 NLP 的序列模型,重點關注以下內容:

  • 用於語言建模的字符級遞歸神經網絡 (RNN)
  • 注意力機制介紹,自註意力和多頭注意力
  • 使用 Hugging Face 轉換器進行問答

NLP:擁抱的臉

Hugging Face 團隊發布了一個免費的 NLP 課程,涵蓋了從基礎到高級的概念,重點介紹瞭如何使用 Hugging Face 生態系統。

Youtube 視頻

先決條件

  • 精通Python
  • 深度學習的工作知識
  • 使用 PyTorch 和 TensorFlow 的經驗(有幫助但不是必需的)

該課程有 12 章,分為三個部分,涵蓋以下內容:

  • 使用 Hugging Face 變形金剛
  • 了解數據集和分詞器庫
  • 變壓器的高級應用,優化生產模型

您可以訪問簡短的視頻講座、基於文本的概念部分和 Colab 筆記本。

定價: 免費

Google Cloud 上的自然語言處理:Pluralsight

Google Cloud 上的 NLP 向學習者介紹如何在 Google Cloud 平台上使用 Vertex AI 構建 NLP 解決方案。

圖片90

先決條件:GCP 的工作知識

本課程向學習者介紹以下內容:

  • 文本表示
  • 使用 DialogFlow API
  • 構建神經網絡、循環神經網絡 (RNN)、長短期記憶 (LSTM) 網絡和門控循環單元 (GRU)
  • 使用頂點人工智能
  • 注意力機制和大型語言模型

使用 Azure 構建 NLP 解決方案

使用 Microsoft Azure 構建 NLP 解決方案是 Pluralsight 上基於項目的課程。 在這個基於項目的課程中,您將學習通過處理客戶評論的推文數據集來構建 NLP 解決方案。

圖片87

先決條件

  • Python編程
  • 熟悉 Azure 門戶

您將在此過程中執行的關鍵任務包括:

  • 語言檢測
  • 命名實體識別
  • 關鍵詞提取
  • 情緒分析

NLP 與 PyTorch:Pluralsight

NLP with PyTorch on Pluralsight 將幫助您開始使用 NLP。 本課程不涵蓋最近的轉換器架構,但涵蓋了使用 PyTorch 進行自然語言處理的大量基礎知識。

圖片88

先決條件:熟悉 PyTorch

本課程涵蓋以下內容:

  • 遞歸神經網絡 (RNN)
  • 二進制和多類文本分類
  • 詞向量嵌入
  • 使用詞向量進行情感分析
  • 用於語言翻譯的序列到序列模型

成為 NLP 專家:Udacity

Becoming a NLP Expert 是優達學城 AI 學院提供的官方自然語言處理納米學位。 這個納米學位課程將幫助您學習傳統和現代 NLP 技術,例如通過構建項目來關註註意力。

圖片86

先決條件

  • Python編程
  • 統計數據
  • 機器學習和深度學習

Udacity 的課程包括視頻講座、編碼練習和頂點項目。 在此自然語言處理課程中,您將構建以下項目:

  • 詞性標註(詞性標註)
  • 端到端機器翻譯模型
  • 語音識別模型

NLP 的代碼優先介紹

如果您想熟悉 NLP 領域,那麼 Fast.ai 的 NLP 代碼優先介紹是一門很棒的課程。 本課程由 Rachel Thomas 教授,涵蓋自然語言處理的傳統方法和神經網絡方法。

先決條件

  • Python編程
  • 機器學習概念
  • 使用 PyTorch 的神經網絡(有幫助但不是必需的)

以下是課程內容的概述:

  1. 傳統 NLP :本節介紹使用正則表達式的文本處理、奇異值分解 (SVD) 等矩陣分解技術以及用於文本分類的樸素貝葉斯。
  2. NLP 的神經網絡方法:課程隨後涵蓋遞歸神經網絡、seq2seq 模型、注意力機制和轉換器模型
  3. NLP 中的倫理問題:本課程也有講座強調使用自然語言處理產生的一些倫理問題,例如偏見和這種虛假信息。

定價: 免費

NLP 與機器學習:教育

這個 NLP with Machine Learning,由 Educative 著重於讓學習者熟悉 NLP 中的重要概念。 從編碼面試準備和系統設計到機器學習,Educative 是流行的在線學習平台之一。

該課程涵蓋以下內容:

  • 詞嵌入
  • 語言模型
  • 文本分類
  • Seq2seq模型

Python 中的 NLP:DataCamp

Datacamp 的 Python 自然語言處理是包含六門課程的結構化技能課程。 這些課程向學習者介紹自然語言處理的不同方面。

先決條件

  • 精通Python
  • 對機器學習的理解

該課程包括以下課程:

  • Introduction to NLP in Python:學習 NLP 基礎知識,例如正則表達式和基於規則的方法。
  • Python 中的情感分析:在真實世界的數據集上構建端到端的情感分析模型,例如電影評論、亞馬遜產品評論和推文。
  • 在 Python 中構建聊天機器人:使用 scikit-learn、spaCy 和 Rasa NLU 庫構建聊天機器人。
  • Advanced NLP with spaCy:使用 spaCy 為命名實體識別等任務構建自然語言處理管道。
  • Spoken Language Processing in Python:學習在 Python 中構建語音識別模型。
  • Python 中 NLP 的特徵工程:學習從文本數據中提取特徵的技術。

NLP課程:Lena Voita

NLP 課程是作者 Lena Voita 在 Yandex 數據分析學院教授的自然語言處理課程的延伸。 該課程分為幾個部分,包含互動課程和博客文章。 此外,還有筆記本和研究論文摘要。

  • 文本分類(傳統和神經網絡方法)
  • 詞嵌入
  • 語言模型的評估
  • Seq2seq模型和注意力
  • NLP 的遷移學習

定價: 免費

結論

我希望您覺得這份學習資源清單對您有所幫助。 根據先決條件和時間承諾,您可以選擇最符合您興趣的課程或專業。 一旦您獲得了基礎知識,請務必在真實世界的數據集上構建項目以補充和加強您的理解。 編碼愉快!

接下來,查看可用於下一個 NLP 項目的數據科學筆記本列表!