13 หลักสูตร NLP ที่ดีที่สุดในการเรียนรู้การประมวลผลภาษาธรรมชาติ

เผยแพร่แล้ว: 2022-11-24

นี่คือรายชื่อหลักสูตรและความเชี่ยวชาญเฉพาะทางของ NLP เพื่อช่วยให้คุณเริ่มต้นเส้นทางการประมวลผลภาษาธรรมชาติของคุณ!

การประมวลผลภาษาธรรมชาติ (NLP) อยู่ที่ จุดบรรจบของวิทยาการคอมพิวเตอร์ และ ภาษาศาสตร์เชิงคำนวณ ตั้งแต่การวิเคราะห์ความคิดเห็นของลูกค้าไปจนถึงการผลักดันการตัดสินใจทางการตลาดไปจนถึงการแปลด้วยคอมพิวเตอร์และแชทบอท NLP กำลังขับเคลื่อนทุกภาคส่วน

หากคุณมีประสบการณ์ในการสร้างโมเดลแมชชีนเลิร์นนิง คุณสามารถเพิ่ม NLP ลงในกล่องเครื่องมือของคุณเพื่อแก้ปัญหาต่างๆ ได้: การสรุปข้อความ การตอบคำถาม การสร้างภาษาธรรมชาติ และอื่นๆ

เราจะพิจารณาข้อกำหนดด้านทักษะกว้างๆ สำหรับบทบาท NLP จากนั้นดำเนินการตามรายการแหล่งข้อมูลที่คัดสรรแล้วเพื่อเริ่มต้นใช้งานการประมวลผลภาษาธรรมชาติ

เส้นทางอาชีพ NLP: วิศวกร NLP, นักพัฒนา NLP และอีกมากมาย

ความก้าวหน้าในการวิจัยได้กระตุ้นการพัฒนาเทคนิค NLP สมัยใหม่ ด้วยเงินเดือนเฉลี่ยมากกว่า 117K USD บทบาทวิศวกร NLP และนักพัฒนาเพิ่งได้รับความนิยม

ชุดทักษะมีความหลากหลายตั้งแต่การรวบรวมข้อมูลสำหรับงาน NLP ขั้นปลายและความรู้ในการทำงานเกี่ยวกับแนวคิดทางภาษาศาสตร์ เช่น การแยกวิเคราะห์การพึ่งพาและการแท็ก Part-of-Speech (POS) ไปจนถึงความรู้ในการทำงานของแบบจำลองหม้อแปลง

เพื่อเข้าสู่ NLP ความเชี่ยวชาญในการเขียนโปรแกรมและการเรียนรู้ของเครื่อง ต้องระบุ. คุณควรมีประสบการณ์เกี่ยวกับเฟรมเวิร์กการเรียนรู้เชิงลึก เช่น PyTorch และ TensorFlow และไลบรารี NLP เช่น spaCy และ HuggingFace

หลักสูตรการประมวลผลภาษาธรรมชาติ (NLP)

ต่อไป มาดูหลักสูตรที่ดีที่สุดที่มีอยู่ในแพลตฟอร์มการเรียนรู้ยอดนิยม นอกจากนี้ เราจะระบุข้อกำหนดเบื้องต้นที่คุณต้องใช้เพื่อให้ได้ประโยชน์สูงสุดจากหลักสูตรเหล่านี้

CS224n: NLP กับการเรียนรู้เชิงลึก

สอนโดย Prof. Chris Manning, CS224n: NLP with Deep Learning ซึ่งเปิดสอนที่ Stanford เป็นหนึ่งในหลักสูตรที่ดีที่สุดในการเรียนรู้การประมวลผลภาษาธรรมชาติ การบรรยายมีอยู่ใน YouTube และบันทึกการบรรยายและสมุดบันทึกแบบฝึกหัด—จากข้อเสนอปัจจุบันและก่อนหน้านี้—มีให้ใช้งานฟรีบนเว็บไซต์ของหลักสูตร

วิดีโอ YouTube

ข้อกำหนดเบื้องต้น

  • การเขียนโปรแกรมด้วยภาษาไพธอน
  • คณิตศาสตร์: สถิติ ความน่าจะเป็น แคลคูลัส พีชคณิตเชิงเส้น
  • รากฐานการเรียนรู้ของเครื่อง

หลักสูตรนี้เป็นหลักสูตรระยะยาวภาคการศึกษาที่ครอบคลุมหัวข้อ NLP ในวงกว้าง:

  • เวกเตอร์คำ
  • เครือข่ายประสาทกำเริบ
  • แบบจำลองความสนใจและคำย่อย
  • หม้อแปลงและการประยุกต์ใช้

ราคา : ฟรี

ความเชี่ยวชาญ NLP: Coursera

ความเชี่ยวชาญด้านการประมวลผลภาษาธรรมชาติโดย DeepLearning.AI บน Coursera เป็นหนึ่งในแหล่งข้อมูลการเรียนรู้ยอดนิยม ความเชี่ยวชาญนี้มีจุดมุ่งหมายเพื่อสอนเทคนิค NLP แบบดั้งเดิมผ่านสี่หลักสูตรไปจนถึงความก้าวหน้าล่าสุด เช่น โมเดลทรานส์ฟอร์เมอร์และรีฟอร์มเมอร์

nlp-หลักสูตร-coursera

ข้อกำหนดเบื้องต้น

  • Python ระดับกลาง
  • การเรียนรู้ของเครื่องและความรู้เกี่ยวกับกรอบการเรียนรู้เชิงลึก
  • แคลคูลัส พีชคณิตเชิงเส้น สถิติ

ต่อไปนี้เป็นหลักสูตรเฉพาะทาง:

  • NLP พร้อมการจำแนกประเภทและเวคเตอร์สเปซ
  • NLP กับโมเดลความน่าจะเป็น
  • NLP กับ Sequence Models
  • NLP กับ Attention Models

แต่ละหลักสูตรในความเชี่ยวชาญจะใช้เวลาเรียนมากกว่า 30 ชั่วโมงและใช้เวลาสองสามเดือนจึงจะจบหลักสูตรเฉพาะทางทั้งหมด

ต่อไปนี้คือโครงการบางส่วนที่คุณจะสร้างขึ้นเมื่อคุณทำงานผ่านความเชี่ยวชาญพิเศษนี้:

  • รูปแบบการเติมข้อความอัตโนมัติ
  • การตอบคำถามโดยใช้ BERT
  • การสรุปข้อความ
  • แชทบอทใช้โมเดลรีฟอร์มเมอร์

NLP ใน TensorFlow: Coursera

หากคุณคุ้นเคยกับ TensorFlow อยู่แล้ว คุณสามารถใช้ NLP ใน TensorFlow โดย DeepLearning.AI บน Coursera เพื่อสร้างโมเดล NLP ด้วย TensorFlow

nlp-หลักสูตร-coursera-tf

ข้อกำหนดเบื้องต้น

  • Python และคณิตศาสตร์
  • ความรู้ในการทำงานของ TensorFlow

หลักสูตรครอบคลุมสิ่งต่อไปนี้:

  • การใช้ TensorFlow API สำหรับการทำโทเค็นข้อความและการประมวลผลล่วงหน้า
  • การฝังคำ
  • การสร้างภาษาธรรมชาติ

แบบจำลองลำดับ: Coursera

หลักสูตร Sequence Models โดย DeepLearning.AI บน Coursera ใน Deep Learning Specialization ได้รับการออกแบบมาเพื่อให้ผู้เรียนมีความรู้ด้าน NLP ในช่วงระยะเวลา 4 สัปดาห์

nlp-หลักสูตร-seq-รุ่น

ข้อกำหนดเบื้องต้น

  • หลาม
  • การเรียนรู้ของเครื่องและพีชคณิตเชิงเส้น

หลักสูตรครอบคลุมโมเดลลำดับสำหรับ NLP โดยเน้นที่สิ่งต่อไปนี้:

  • เครือข่ายประสาทที่เกิดซ้ำระดับอักขระ (RNNs) สำหรับการสร้างแบบจำลองภาษา
  • ความรู้เบื้องต้นเกี่ยวกับกลไกการให้ความสนใจ ความสนใจของตนเองและหลายหัว
  • การใช้ Hugging Face Transformers ในการตอบคำถาม

NLP: กอดหน้า

ทีม Hugging Face เปิดตัวหลักสูตร NLP ฟรี ซึ่งครอบคลุมแนวคิดพื้นฐานไปจนถึงขั้นสูง โดยเน้นที่การทำงานร่วมกับระบบนิเวศ Hugging Face

วิดีโอ YouTube

ข้อกำหนดเบื้องต้น

  • ความเชี่ยวชาญใน Python
  • ความรู้ในการทำงานของการเรียนรู้เชิงลึก
  • ประสบการณ์กับ PyTorch และ TensorFlow (มีประโยชน์แต่ไม่จำเป็น)

หลักสูตรนี้มี 12 บทและแบ่งออกเป็นสามส่วนซึ่งครอบคลุมเนื้อหาต่อไปนี้:

  • ใช้ Hugging Face แปลงร่าง
  • ทำความเข้าใจกับชุดข้อมูลและไลบรารี Tokenizers
  • การใช้งานขั้นสูงของหม้อแปลง การปรับโมเดลให้เหมาะสมสำหรับการผลิต

คุณมีสิทธิ์เข้าถึงวิดีโอบรรยายสั้นๆ ส่วนที่เป็นข้อความสำหรับแนวคิด และสมุดบันทึก Colab

ราคา : ฟรี

NLP บน Google Cloud: Pluralsight

NLP บน Google Cloud แนะนำผู้เรียนในการสร้างโซลูชัน NLP โดยใช้ Vertex AI บนแพลตฟอร์ม Google Cloud

ภาพ-90

วิชาบังคับก่อน : ความรู้ในการทำงานของ GCP

หลักสูตรนี้แนะนำผู้เรียนเกี่ยวกับสิ่งต่อไปนี้:

  • การแสดงข้อความ
  • การทำงานกับ DialogFlow API
  • การสร้างเครือข่ายนิวรัล เครือข่ายนิวรัลที่เกิดซ้ำ (RNN) เครือข่ายหน่วยความจำระยะสั้นระยะยาว (LSTM) และหน่วยที่เกิดซ้ำแบบเกท (GRUs)
  • การใช้ Vertex AI
  • กลไกการดึงดูดความสนใจและโมเดลภาษาขนาดใหญ่

สร้างโซลูชัน NLP ด้วย Azure

การสร้างโซลูชัน NLP ด้วย Microsoft Azure เป็นหลักสูตรตามโครงการบน Pluralsight ในหลักสูตรตามโครงการนี้ คุณจะได้เรียนรู้วิธีสร้างโซลูชัน NLP โดยการประมวลผลชุดข้อมูลทวีตของบทวิจารณ์ของลูกค้า

อิมเมจ-87

ข้อกำหนดเบื้องต้น

  • การเขียนโปรแกรมด้วยภาษาไพธอน
  • ความคุ้นเคยกับพอร์ทัล Azure

งานหลักที่คุณต้องทำระหว่างทางมีดังต่อไปนี้:

  • การตรวจจับภาษา
  • การรับรู้เอนทิตีที่มีชื่อ
  • การสกัดวลีสำคัญ
  • การวิเคราะห์ความรู้สึก

NLP กับ PyTorch: พหูพจน์

NLP กับ PyTorch บน Pluralsight จะช่วยให้คุณเริ่มต้นกับ NLP ได้ หลักสูตรนี้ไม่ครอบคลุมถึงสถาปัตยกรรมทรานส์ฟอร์มล่าสุด แต่ครอบคลุมพื้นฐานมากมายเกี่ยวกับการประมวลผลภาษาธรรมชาติด้วย PyTorch

ภาพ-88

วิชาบังคับก่อน : คุ้นเคยกับ PyTorch

หลักสูตรนี้ครอบคลุมสิ่งต่อไปนี้:

  • เครือข่ายประสาทกำเริบ (RNNs)
  • การจำแนกข้อความแบบไบนารีและหลายคลาส
  • การฝังเวกเตอร์คำ
  • การวิเคราะห์ความรู้สึกโดยใช้เวกเตอร์คำ
  • แบบจำลองลำดับต่อลำดับสำหรับการแปลภาษา

การเป็นผู้เชี่ยวชาญ NLP: Udacity

การเป็นผู้เชี่ยวชาญ NLP เป็นหลักสูตรการประมวลผลภาษาธรรมชาติระดับนาโนที่เปิดสอนโดย Udacity's School of AI หลักสูตรระดับนาโนนี้จะช่วยให้คุณเรียนรู้ทั้งเทคนิค NLP แบบดั้งเดิมและสมัยใหม่ เช่น การให้ความสนใจโดยการสร้างโครงการ

อิมเมจ-86

ข้อกำหนดเบื้องต้น

  • การเขียนโปรแกรมด้วยภาษาไพธอน
  • สถิติ
  • การเรียนรู้ของเครื่องและการเรียนรู้เชิงลึก

โปรแกรมของ Udacity ประกอบด้วยวิดีโอบรรยาย แบบฝึกหัดการเขียนโค้ด และโปรเจกต์สุดหิน ในหลักสูตรการประมวลผลภาษาธรรมชาติ คุณจะได้สร้างโครงการต่อไปนี้:

  • ส่วนหนึ่งของการแท็กด้วยคำพูด (POS Tagging)
  • โมเดลการแปลด้วยเครื่องแบบ end-to-end
  • แบบจำลองการรู้จำเสียง

ความรู้เบื้องต้นเกี่ยวกับรหัสสำหรับ NLP

Code-First Introduction to NLP เป็นหลักสูตรที่ยอดเยี่ยมโดย fast.ai หากคุณต้องการทำความคุ้นเคยกับขอบเขตของ NLP หลักสูตรนี้สอนโดย Rachel Thomas และครอบคลุมแนวทางเครือข่ายประสาทแบบดั้งเดิมและโครงข่ายประสาทเทียมในการประมวลผลภาษาธรรมชาติ

ข้อกำหนดเบื้องต้น

  • การเขียนโปรแกรมด้วยภาษาไพธอน
  • แนวคิดการเรียนรู้ของเครื่อง
  • โครงข่ายประสาทเทียมด้วย PyTorch (มีประโยชน์แต่ไม่จำเป็น)

นี่คือภาพรวมของสิ่งที่หลักสูตรครอบคลุม:

  1. NLP แบบดั้งเดิม : ส่วนนี้ครอบคลุมการประมวลผลข้อความโดยใช้นิพจน์ทั่วไป เทคนิคการแยกตัวประกอบของเมทริกซ์ เช่น Singular Value Decomposition (SVD) และ Naive Bayes สำหรับการจำแนกข้อความ
  2. แนวทางโครงข่ายประสาทเทียมสู่ NLP : หลักสูตรนี้ครอบคลุมโครงข่ายประสาทเทียมที่เกิดซ้ำ แบบจำลอง seq2seq กลไกความสนใจ และแบบจำลองหม้อแปลงไฟฟ้า
  3. ประเด็นด้านจริยธรรมใน NLP : หลักสูตรนี้ยังมีการบรรยายที่เน้นประเด็นด้านจริยธรรมที่เกิดจากการใช้การประมวลผลภาษาธรรมชาติ เช่น อคติและข้อมูลบิดเบือนนี้

ราคา : ฟรี

NLP กับการเรียนรู้ของเครื่อง: ความรู้

NLP with Machine Learning นี้โดย Educative มุ่งเน้นให้ผู้เรียนคุ้นเคยกับแนวคิดที่สำคัญใน NLP Educative เป็นหนึ่งในแพลตฟอร์มการเรียนรู้ออนไลน์ที่ได้รับความนิยม ตั้งแต่การเตรียมการสัมภาษณ์และการออกแบบระบบไปจนถึงการเรียนรู้ของเครื่อง

หลักสูตรครอบคลุมสิ่งต่อไปนี้:

  • การฝังคำ
  • โมเดลภาษา
  • การจำแนกข้อความ
  • โมเดล seq2seq

NLP ใน Python: DataCamp

การประมวลผลภาษาธรรมชาติใน Python โดย Datacamp เป็นหลักสูตรทักษะที่มีโครงสร้างของหกหลักสูตร หลักสูตรเหล่านี้จะแนะนำให้ผู้เรียนรู้จักแง่มุมต่างๆ ของการประมวลผลภาษาธรรมชาติ

ข้อกำหนดเบื้องต้น

  • ความเชี่ยวชาญใน Python
  • ความเข้าใจเกี่ยวกับการเรียนรู้ของเครื่อง

แทร็กนี้ประกอบด้วยหลักสูตรต่อไปนี้:

  • บทนำเกี่ยวกับ NLP ใน Python: เรียนรู้พื้นฐาน NLP เช่น นิพจน์ทั่วไปและเมธอดตามกฎ
  • การวิเคราะห์ความคิดเห็นใน Python: สร้างโมเดลการวิเคราะห์ความคิดเห็นแบบ end-to-end ในชุดข้อมูลจริง เช่น บทวิจารณ์ภาพยนตร์ บทวิจารณ์ผลิตภัณฑ์ของ Amazon และทวีต
  • การสร้างแชทบอทใน Python: สร้างแชทบอทโดยใช้ไลบรารี scikit-learn, spaCy และ Rasa NLU
  • NLP ขั้นสูงพร้อม spaCy: สร้างไปป์ไลน์การประมวลผลภาษาธรรมชาติโดยใช้ spaCy สำหรับงานต่างๆ เช่น การจดจำเอนทิตีที่มีชื่อ
  • การประมวลผลภาษาพูดใน Python: เรียนรู้วิธีสร้างแบบจำลองการรู้จำเสียงใน Python
  • วิศวกรรมคุณลักษณะสำหรับ NLP ใน Python: เรียนรู้เทคนิคในการดึงคุณลักษณะจากข้อมูลข้อความ

หลักสูตร NLP: Lena Voita

หลักสูตร NLP เป็นส่วนเสริมของหลักสูตรการประมวลผลภาษาธรรมชาติที่ผู้เขียน Lena Voita สอนอยู่ที่ Yandex School of Data Analysis หลักสูตรนี้จัดเป็นส่วนๆ และมีบทเรียนเชิงโต้ตอบและบล็อกโพสต์ นอกจากนี้ยังมีสมุดจดและสรุปผลงานวิจัย

  • การจำแนกประเภทข้อความ (ทั้งวิธีดั้งเดิมและวิธีโครงข่ายประสาทเทียม)
  • การฝังคำ
  • การประเมินแบบจำลองทางภาษา
  • โมเดล seq2seq และความสนใจ
  • ถ่ายทอดการเรียนรู้ NLP

ราคา : ฟรี

บทสรุป

ฉันหวังว่าคุณจะพบว่ารายการทรัพยากรการเรียนรู้นี้มีประโยชน์ ขึ้นอยู่กับข้อกำหนดเบื้องต้นและความมุ่งมั่นของเวลา คุณสามารถเลือกหลักสูตรหรือความเชี่ยวชาญที่สอดคล้องกับความสนใจของคุณได้ดีที่สุด เมื่อคุณได้รับความรู้พื้นฐานแล้ว อย่าลืมสร้างโครงการบนชุดข้อมูลจริงเพื่อเสริมและเสริมความเข้าใจของคุณ มีความสุขในการเข้ารหัส!

ต่อไป ตรวจสอบรายการสมุดบันทึกด้านวิทยาศาสตร์ข้อมูลที่คุณสามารถใช้สำหรับโครงการ NLP ถัดไปของคุณ!