Unsupervised Learning: วิธีการที่เครื่องเรียนรู้ด้วยตัวเอง

เผยแพร่แล้ว: 2021-03-19

การเรียนรู้แบบไม่มีผู้ดูแลช่วยให้เครื่องเรียนรู้ด้วยตนเอง

แมชชีนเลิร์นนิง (ML) ประเภทนี้ช่วยให้แอปพลิเคชัน AI สามารถเรียนรู้และค้นหารูปแบบที่ซ่อนอยู่ในชุดข้อมูลขนาดใหญ่โดยไม่ต้องมีมนุษย์ควบคุม การเรียนรู้โดยไม่ได้รับการดูแลก็มีความสำคัญต่อการบรรลุเช่นกัน   ปัญญาประดิษฐ์ทั่วไป

ข้อมูลการติดฉลากต้องใช้แรงงานจำนวนมากและใช้เวลานาน และในหลายกรณีก็ไม่สามารถทำได้ นั่นคือจุดที่การเรียนรู้แบบไม่มีผู้ดูแลทำให้เกิดความแตกต่างอย่างมากโดยให้แอปพลิเคชัน AI สามารถเรียนรู้ได้โดยไม่ต้องมีป้ายกำกับและการควบคุมดูแล

การเรียนรู้แบบไม่มีผู้ดูแลคืออะไร?

Unsupervised Learning (UL) เป็นเทคนิคการเรียนรู้ของเครื่องที่ใช้ในการระบุรูปแบบในชุดข้อมูลที่มีจุดข้อมูลที่ไม่จัดประเภทและไม่มีป้ายกำกับ ในวิธีการเรียนรู้นี้ ระบบ AI จะได้รับเฉพาะข้อมูลอินพุตและไม่มีข้อมูลเอาต์พุตที่เกี่ยวข้อง

ไม่เหมือนกับ การเรียนรู้ภายใต้การ ดูแล แมชชีนเลิร์นนิงแบบไม่อยู่ภายใต้การดูแลไม่ต้องการให้มนุษย์ดูแลโมเดล นักวิทยาศาสตร์ข้อมูลช่วยให้เครื่องเรียนรู้โดยการสังเกตข้อมูลและค้นหารูปแบบด้วยตัวเอง กล่าวอีกนัยหนึ่งหมวดหมู่ย่อยของการเรียนรู้ด้วยเครื่องนี้ช่วยให้ระบบสามารถดำเนินการกับข้อมูลที่กำหนดโดยไม่มีคำแนะนำจากภายนอก

เทคนิคการเรียนรู้โดยไม่ได้รับการดูแลเป็นสิ่งสำคัญสำหรับการสร้างระบบปัญญาประดิษฐ์ด้วยปัญญาของมนุษย์ นั่นเป็นเพราะว่าเครื่องจักรอัจฉริยะจะต้องสามารถตัดสินใจ (เป็นอิสระ) ได้โดยการวิเคราะห์ข้อมูลที่ไม่ได้ติดแท็กปริมาณมาก

เมื่อเทียบกับอัลกอริธึมการเรียนรู้ภายใต้การดูแล อัลกอริธึม UL เชี่ยวชาญในการทำงานที่ซับซ้อนมากกว่า อย่างไรก็ตาม โมเดลการเรียนรู้ภายใต้การดูแลจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น เนื่องจากผู้สอนบอกระบบอย่างชัดเจนว่าต้องค้นหาอะไรในข้อมูลที่กำหนด แต่ในกรณีของการเรียนรู้แบบ unsupervised สิ่งต่าง ๆ ค่อนข้างคาดเดาไม่ได้

โครงข่ายประสาทเทียมซึ่งทำให้   การเรียนรู้อย่างลึกซึ้ง   ความเป็นจริง อาจดูเหมือนได้รับการสนับสนุนจากการเรียนรู้แบบไม่มีผู้ดูแล แม้ว่าจะเป็นความจริง แต่อัลกอริธึมการเรียนรู้ของโครงข่ายประสาทเทียมยังสามารถดูแลได้หากทราบผลลัพธ์ที่ต้องการแล้ว

การเรียนรู้โดยไม่ได้รับการดูแลสามารถเป็นเป้าหมายในตัวเองได้ ตัวอย่างเช่น สามารถใช้โมเดล UL เพื่อค้นหารูปแบบที่ซ่อนอยู่ในข้อมูลปริมาณมหาศาล และแม้กระทั่งสำหรับการจัดประเภทและติดป้ายกำกับจุดข้อมูล การจัดกลุ่มจุดข้อมูลที่ไม่เรียงลำดับจะดำเนินการโดยการระบุความเหมือนและความแตกต่าง

เหตุผลบางประการที่การเรียนรู้โดยไม่ได้รับการดูแลเป็นสิ่งสำคัญ

  • ข้อมูลที่ไม่มีป้ายกำกับมีมากมาย
  • การติดฉลากข้อมูลเป็นงานที่น่าเบื่อซึ่งต้องใช้แรงงานคน อย่างไรก็ตาม กระบวนการนี้สามารถขับเคลื่อนด้วย ML ได้ ทำให้การติดฉลากง่ายขึ้นสำหรับมนุษย์ที่เกี่ยวข้อง
  • มีประโยชน์สำหรับการสำรวจข้อมูลที่ไม่รู้จักและข้อมูลดิบ
  • มีประโยชน์สำหรับการดำเนินการจดจำรูปแบบในชุดข้อมูลขนาดใหญ่
การเรียนรู้แบบไม่มีผู้ดูแลสามารถแบ่งออกเป็นสองประเภทเพิ่มเติม: การเรียนรู้แบบไม่อยู่ภายใต้การดูแลแบบอิงพารามิเตอร์ และ การเรียนรู้ แบบไม่อยู่ภายใต้การควบคุมแบบไม่ใช้พารามิเตอร์

การเรียนรู้แบบไม่มีผู้ดูแลทำงานอย่างไร

พูดง่ายๆ ก็คือ การเรียนรู้ที่ไม่มีผู้ดูแลทำงานโดยการวิเคราะห์ข้อมูลที่ไม่มีหมวดหมู่ ไม่มีป้ายกำกับ และค้นหาโครงสร้างที่ซ่อนอยู่ในนั้น

ในการเรียนรู้ภายใต้การดูแล นักวิทยาศาสตร์ข้อมูลจะป้อนข้อมูลระบบด้วยข้อมูลที่มีป้ายกำกับ เช่น รูปภาพของแมวที่ติดป้ายกำกับว่าเป็นแมว เพื่อให้สามารถเรียนรู้ได้จากตัวอย่าง ในการเรียนรู้โดยไม่ได้รับการดูแล นักวิทยาศาสตร์ด้านข้อมูลจะจัดเตรียมแค่ภาพถ่ายเท่านั้น และเป็นความรับผิดชอบของระบบในการวิเคราะห์ข้อมูลและสรุปว่าเป็นรูปแมวหรือไม่

แมชชีนเลิร์นนิงที่ไม่ได้รับการดูแลต้องการข้อมูลปริมาณมหาศาล ในกรณีส่วนใหญ่ การเรียนรู้ภายใต้การดูแลก็เช่นเดียวกัน เนื่องจากโมเดลมีความแม่นยำมากขึ้นพร้อมตัวอย่างมากขึ้น

กระบวนการของการเรียนรู้โดยไม่ได้รับการดูแลเริ่มต้นด้วยนักวิทยาศาสตร์ข้อมูลฝึกอัลกอริทึมโดยใช้ชุดข้อมูลการฝึกอบรม จุดข้อมูลในชุดข้อมูลเหล่านี้ไม่มีป้ายกำกับและไม่มีการจัดหมวดหมู่

เป้าหมายการเรียนรู้ของอัลกอริทึมคือการระบุรูปแบบภายในชุดข้อมูลและจัดหมวดหมู่จุดข้อมูลตามรูปแบบที่ระบุเหมือนกัน ในตัวอย่างของภาพแมว อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลสามารถเรียนรู้ที่จะระบุลักษณะเฉพาะของแมว เช่น หนวด หางยาว และกรงเล็บที่หดได้

หากคุณลองคิดดู การเรียนรู้โดยไม่ได้รับการดูแลคือวิธีที่เราเรียนรู้ที่จะระบุและจัดหมวดหมู่สิ่งต่างๆ สมมติว่าคุณไม่เคยชิมซอสมะเขือเทศหรือซอสพริก หากคุณได้รับซอสมะเขือเทศและซอสพริกที่ "ไม่มีป้ายกำกับ" สองขวด และขอให้ลองชิม คุณจะสามารถแยกความแตกต่างระหว่างรสชาติได้

คุณยังสามารถระบุลักษณะเฉพาะของซอสทั้งสองชนิดได้ (อันหนึ่งเปรี้ยวและอีกอันเผ็ด) แม้ว่าคุณจะไม่รู้จักชื่อซอสทั้งสองชนิด การชิมแต่ละครั้งอีกสองสามครั้งจะทำให้คุณคุ้นเคยกับรสชาติมากขึ้น ในไม่ช้า คุณจะสามารถจัดกลุ่มอาหารตามซอสที่เติมเพียงแค่ชิม

เมื่อวิเคราะห์รสชาติแล้ว คุณจะพบคุณลักษณะเฉพาะที่ทำให้ซอสทั้งสองชนิดและอาหารจานกลุ่มแตกต่างกัน คุณไม่จำเป็นต้องรู้ชื่อซอสหรือชื่ออาหารเพื่อจัดหมวดหมู่ คุณอาจจะเรียก ซอสหวานและซอส ร้อน อื่นๆ

ซึ่งคล้ายกับวิธีที่เครื่องระบุรูปแบบและจัดประเภทจุดข้อมูลด้วยความช่วยเหลือของการเรียนรู้แบบไม่มีผู้ดูแล ในตัวอย่างเดียวกัน การเรียนรู้ภายใต้การดูแลจะเป็นคนที่บอกคุณถึงชื่อของซอสทั้งสองชนิดและรสชาติของซอสล่วงหน้า

ประเภทของการเรียนรู้แบบไม่มีผู้ดูแล

ปัญหาการเรียนรู้ที่ไม่ได้รับการดูแลสามารถจำแนกได้เป็นปัญหาการจัด กลุ่ม และการ เชื่อมโยง

การจัดกลุ่ม

คลัสเตอร์หรือการวิเคราะห์คลัสเตอร์เป็นกระบวนการของการจัดกลุ่มออบเจ็กต์เป็นกลุ่ม รายการที่มีความคล้ายคลึงกันมากที่สุดจะถูกจัดกลุ่มไว้ด้วยกัน ในขณะที่รายการที่เหลือจะจัดอยู่ในกลุ่มอื่นๆ ตัวอย่างของการจัดกลุ่มคือการจัดกลุ่มผู้ใช้ YouTube ตามประวัติการดูของพวกเขา

ขึ้นอยู่กับวิธีการทำงาน การจัดกลุ่มสามารถแบ่งออกเป็นสี่กลุ่มดังนี้:

  • การทำ คลัสเตอร์แบบเอกสิทธิ์เฉพาะบุคคล: ตามชื่อที่แนะนำ การทำคลัสเตอร์แบบเอกสิทธิ์เฉพาะบุคคลระบุว่าจุดข้อมูลหรืออ็อบเจ็กต์สามารถมีอยู่ในคลัสเตอร์เดียวเท่านั้น
  • การ จัดกลุ่มตามลำดับชั้น: ลำดับชั้นพยายามสร้างลำดับชั้นของคลัสเตอร์ การจัดกลุ่มตามลำดับชั้นมีสองประเภท: agglomerative และ divivive Agglomerative เป็นไปตามแนวทางจากล่างขึ้นบน โดยเริ่มแรกถือว่าแต่ละจุดข้อมูลเป็นคลัสเตอร์เดี่ยว และคู่ของคลัสเตอร์จะรวมกันเมื่อเลื่อนขึ้นลำดับชั้น การแตกแยกเป็นสิ่งที่ตรงกันข้ามกับการรวมตัวกัน จุดข้อมูลทุกจุดเริ่มต้นในคลัสเตอร์เดียวและแยกส่วนเมื่อย้ายลงลำดับชั้น
  • การทำ คลัสเตอร์ที่ทับซ้อนกัน: การทับซ้อนกันช่วยให้สามารถจัดกลุ่มจุดข้อมูลเป็นคลัสเตอร์ตั้งแต่สองคลัสเตอร์ขึ้นไป
  • การ จัดกลุ่มความน่าจะเป็น: ความน่าจะเป็นใช้การแจกแจงความน่าจะเป็นเพื่อสร้างคลัสเตอร์ ตัวอย่างเช่น "ถุงเท้าสีเขียว" "ถุงเท้าสีน้ำเงิน" "เสื้อยืดสีเขียว" และ "เสื้อยืดสีน้ำเงิน" สามารถจัดกลุ่มเป็น 2 ประเภทคือ "สีเขียว" และ "สีน้ำเงิน" หรือ "ถุงเท้า" และ "เสื้อยืด" ".

สมาคม

การเรียนรู้กฎการเชื่อมโยง (ARL) เป็นวิธีการเรียนรู้แบบไม่มีผู้ดูแลที่ใช้เพื่อค้นหาความสัมพันธ์ระหว่างตัวแปรในฐานข้อมูลขนาดใหญ่ ไม่เหมือนกับอัลกอริธึมการเรียนรู้ของเครื่องบางตัว ARL สามารถจัดการจุดข้อมูลที่ไม่ใช่ตัวเลขได้

ในแง่ที่ง่ายกว่า ARL คือการค้นหาว่าตัวแปรบางตัวเชื่อมโยงกันอย่างไร ตัวอย่างเช่น คนที่ซื้อมอเตอร์ไซค์มักจะซื้อหมวกกันน็อค

การค้นหาความสัมพันธ์ดังกล่าวสามารถทำกำไรได้ ตัวอย่างเช่น หากลูกค้าที่ซื้อ Product X มักจะซื้อ Product Y ผู้ค้าปลีกออนไลน์สามารถแนะนำ Product Y ให้กับทุกคนที่ซื้อ Product X

การเรียนรู้กฎของสมาคมใช้คำสั่ง if/then เป็นหลัก ข้อความเหล่านี้สามารถเปิดเผยความสัมพันธ์ระหว่างข้อมูลอิสระ นอกจากนี้ สังเกตรูปแบบ if/then หรือความสัมพันธ์โดยใช้ การสนับสนุน และ ความมั่นใจ

ฝ่ายสนับสนุนระบุความถี่ที่ความสัมพันธ์แบบ if/then ปรากฏในฐานข้อมูล ความเชื่อมั่นกำหนดจำนวนครั้งที่พบว่าความสัมพันธ์แบบ if/then นั้นถูกต้อง

การวิเคราะห์ตะกร้าตลาด   และ   การขุดการใช้เว็บ   เป็นไปได้ด้วยกฎสมาคม

อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแล

การเรียนรู้กฎการจัดกลุ่มและการเชื่อมโยงนั้นดำเนินการโดยใช้อัลกอริทึม

อัลกอริธึม Apriori, อัลกอริธึม ECLAT และอัลกอริธึมการขยายรูปแบบความถี่ (FP) เป็นอัลกอริธึมที่โดดเด่นบางส่วนที่ใช้ในการนำกฎการเชื่อมโยงไปใช้ การทำคลัสเตอร์ทำได้โดยอัลกอริทึม เช่น การจัดกลุ่ม k-mean และการวิเคราะห์องค์ประกอบหลัก (PCA)

อัลกอริทึม Apriori

อัลกอริทึม Apriori สร้างขึ้นสำหรับการขุดข้อมูล มีประโยชน์สำหรับฐานข้อมูลการขุดที่มีธุรกรรมจำนวนมาก เช่น ฐานข้อมูลที่มีรายการสินค้าที่ผู้ซื้อในซูเปอร์มาร์เก็ตซื้อ ใช้สำหรับระบุผลกระทบที่เป็นอันตรายของยาและในการวิเคราะห์ตะกร้าตลาดเพื่อค้นหาชุดของรายการที่ลูกค้ามีแนวโน้มที่จะซื้อร่วมกัน

อัลกอริทึม ECLAT

Equivalence Class Clustering และ Lattice Traversal จากล่างขึ้น บน หรือเรียกสั้นๆ ว่า ECLAT เป็นอัลกอริธึมการทำเหมืองข้อมูลที่ใช้เพื่อให้เกิดการขุด itemset และค้นหารายการที่พบบ่อย

อัลกอริทึม Apriori ใช้รูปแบบข้อมูลแนวนอน ดังนั้นจำเป็นต้องสแกนฐานข้อมูลหลายครั้งเพื่อระบุรายการที่ใช้บ่อย ในทางกลับกัน ECLAT ใช้วิธีแนวตั้งและโดยทั่วไปจะเร็วกว่า เนื่องจากจำเป็นต้องสแกนฐานข้อมูลเพียงครั้งเดียว

อัลกอริธึมการเติบโตของรูปแบบบ่อย (FP)

อัลกอริธึมการเติบโตรูปแบบบ่อย (FP) เป็นอัลกอริธึม Apriori รุ่นปรับปรุง อัลกอริธึมนี้แสดงฐานข้อมูลในรูปแบบของโครงสร้างต้นไม้ที่เรียกว่า ต้นไม้ หรือ รูปแบบ ที่ใช้บ่อย

ต้นไม้ที่ใช้บ่อยดังกล่าวใช้สำหรับขุดรูปแบบที่พบบ่อยที่สุด ในขณะที่อัลกอริทึม Apriori จำเป็นต้องสแกนฐานข้อมูล n+1 ครั้ง (โดยที่ n คือความยาวของโมเดลที่ยาวที่สุด) อัลกอริทึม FP-growth ต้องการการสแกนเพียงสองครั้ง

K-หมายถึงการจัดกลุ่ม

การทำซ้ำหลายครั้งของอัลกอริทึม k-mean มีการใช้กันอย่างแพร่หลายในด้านวิทยาศาสตร์ข้อมูล พูดง่ายๆ ก็คือ อัลกอริทึมการจัดกลุ่ม k-mean จะจัดกลุ่มรายการที่คล้ายคลึงกันเป็นคลัสเตอร์ จำนวนคลัสเตอร์แสดงด้วย k ดังนั้นหากค่าของ k เป็น 3 จะมีทั้งหมดสามกลุ่ม

วิธีการจัดกลุ่มนี้จะแบ่งชุดข้อมูลที่ไม่มีป้ายกำกับ เพื่อให้แต่ละจุดข้อมูลอยู่ในกลุ่มเดียวที่มีคุณสมบัติคล้ายคลึงกัน กุญแจสำคัญคือการหา K centers ที่เรียกว่า คลัสเตอร์ centroids

แต่ละคลัสเตอร์จะมีคลัสเตอร์เซนทรอยด์หนึ่งอัน และเมื่อเห็นจุดข้อมูลใหม่ อัลกอริธึมจะกำหนดคลัสเตอร์ที่ใกล้ที่สุดที่จุดข้อมูลอยู่ตามเมตริก เช่น ระยะทางแบบยุคลิด

การวิเคราะห์องค์ประกอบหลัก (PCA)

การ วิเคราะห์องค์ประกอบหลัก (PCA) เป็นวิธีการลดมิติซึ่งโดยทั่วไปจะใช้เพื่อลดมิติของชุดข้อมูลขนาดใหญ่ โดยแปลงตัวแปรจำนวนมากเป็นตัวแปรที่เล็กกว่าซึ่งมีข้อมูลเกือบทั้งหมดในชุดข้อมูลขนาดใหญ่

การลดจำนวนตัวแปรอาจส่งผลต่อความแม่นยำเล็กน้อย แต่อาจเป็นการแลกเปลี่ยนที่ยอมรับได้สำหรับความเรียบง่าย นั่นเป็นเพราะว่าชุดข้อมูลที่เล็กกว่านั้นวิเคราะห์ได้ง่ายกว่า และอัลกอริธึมการเรียนรู้ของเครื่องไม่ต้องทำงานหนักมากเพื่อให้ได้มาซึ่งข้อมูลเชิงลึกอันมีค่า

การเรียนรู้แบบมีผู้ดูแล vs. การเรียนรู้แบบไม่มีผู้ดูแล

การเรียนรู้ภายใต้การดูแลนั้นคล้ายกับการให้ครูดูแลกระบวนการเรียนรู้ทั้งหมด นอกจากนี้ยังมีชุดข้อมูลการฝึกอบรมที่มีป้ายกำกับซึ่งคล้ายกับการมีคำตอบที่ถูกต้องสำหรับแต่ละปัญหาที่คุณกำลังพยายามแก้ไข

ง่ายกว่าที่จะเข้าใจว่าคำตอบของคุณถูกต้องหรือไม่ และครูจะแก้ไขให้คุณเมื่อคุณทำผิดพลาด ในกรณีของการเรียนรู้แบบไม่มีผู้ดูแล ไม่มีครูหรือคำตอบที่ถูกต้อง

จากมุมมองของการคำนวณ การเรียนรู้แบบไม่มีผู้ดูแลจะซับซ้อนและใช้เวลานานกว่าการเรียนรู้ภายใต้การดูแล อย่างไรก็ตาม มันมีประโยชน์สำหรับการขุดข้อมูลและเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับโครงสร้างของข้อมูลก่อนที่จะกำหนดตัว แยกประเภท ใดๆ (อัลกอริธึมการเรียนรู้ของเครื่องที่จัดประเภทข้อมูลโดยอัตโนมัติ)

แม้จะมีประโยชน์เมื่อข้อมูลที่ไม่มีป้ายกำกับนั้นมีขนาดใหญ่มาก แต่การเรียนรู้โดยไม่ได้รับการดูแลก็อาจทำให้นักวิทยาศาสตร์ข้อมูลไม่สะดวกเพียงเล็กน้อย เนื่องจากชุดข้อมูลการตรวจสอบความถูกต้องที่ใช้ในการเรียนรู้ภายใต้การดูแลยังมีการกำกับไว้ด้วย นักวิทยาศาสตร์ข้อมูลจึงวัดความแม่นยำของแบบจำลองได้ง่ายขึ้น แต่สิ่งเดียวกันนี้ไม่เป็นความจริงสำหรับรูปแบบการเรียนรู้ที่ไม่มีผู้ดูแล

ในหลายกรณี การเรียนรู้แบบไม่มีผู้ดูแลจะถูกนำมาใช้ก่อนการเรียนรู้ภายใต้การดูแล ซึ่งจะช่วยในการระบุคุณลักษณะและสร้างชั้นเรียน

กระบวนการเรียนรู้แบบไม่มีผู้ดูแลเกิดขึ้นทางออนไลน์ ในขณะที่การเรียนรู้ภายใต้การดูแลเกิดขึ้นแบบออฟไลน์ ซึ่งช่วยให้อัลกอริธึม UL สามารถประมวลผลข้อมูลได้แบบเรียลไทม์

ในขณะที่ปัญหาการเรียนรู้ที่ไม่ได้รับการดูแลจะแบ่งออกเป็นปัญหาความสัมพันธ์และการจัดกลุ่ม การเรียนรู้ภายใต้การดูแลสามารถจัดประเภทเพิ่มเติมได้เป็นการถดถอยและการจำแนก

นอกเหนือจากการเรียนรู้ภายใต้การดูแลและการเรียนรู้แบบไม่มีผู้ดูแลแล้ว ยังมีการเรียนรู้ แบบกึ่งควบคุม และ การเรียนรู้แบบเสริมกำลัง

การเรียนรู้แบบกึ่งควบคุมดูแลเป็นการผสมผสานระหว่างการเรียนรู้ แบบมีผู้สอนและแบบไม่มีผู้ดูแล ในเทคนิคแมชชีนเลิร์นนิงนี้ ระบบได้รับการฝึกอบรมเพียงเล็กน้อยเพื่อให้ได้รับภาพรวมในระดับสูง ส่วนหนึ่งของข้อมูลการฝึกอบรมจะถูกติดป้ายกำกับ และส่วนที่เหลือจะไม่มีป้ายกำกับ

ใน การเรียนรู้การเสริมแรง (RL) ระบบปัญญาประดิษฐ์จะพบกับสภาพแวดล้อมที่เหมือนเกมซึ่งจะต้องได้รับรางวัลสูงสุด ระบบต้องเรียนรู้โดยทำตามวิธีการลองผิดลองถูกและเพิ่มโอกาสในการได้รับรางวัลในแต่ละขั้นตอน

มาดูความแตกต่างที่สำคัญระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลโดยย่อ

การเรียนรู้แบบไม่มีผู้ดูแล การเรียนรู้ภายใต้การดูแล
เป็นกระบวนการที่ซับซ้อน ต้องใช้ทรัพยากรในการคำนวณมากขึ้นและใช้เวลานาน ค่อนข้างง่ายและต้องใช้ทรัพยากรในการคำนวณน้อยลง
ชุดข้อมูลการฝึกอบรมไม่มีป้ายกำกับ มีป้ายกำกับชุดข้อมูลการฝึกอบรม
แม่นยำน้อยกว่า แต่ไม่จำเป็น แม่นยำสูง
แบ่งออกเป็นสมาคมและคลัสเตอร์ แบ่งออกเป็นการถดถอยและการจำแนกประเภท
การวัดความแม่นยำของแบบจำลองควบคู่ไปกับความไม่แน่นอนนั้นเป็นเรื่องยุ่งยาก การวัดความแม่นยำของแบบจำลองนั้นง่ายกว่า
ไม่ทราบจำนวนคลาส ทราบจำนวนคลาสแล้ว
การเรียนรู้เกิดขึ้นแบบเรียลไทม์ การเรียนรู้เกิดขึ้นแบบออฟไลน์
อัลกอริธึมการเติบโต Apriori, ECLAT, k-means clustering และ Frequent pattern (FP) คืออัลกอริธึมบางส่วนที่ใช้ การถดถอยเชิงเส้น การถดถอยโลจิสติก อ่าวไร้เดียงสา และเวกเตอร์เครื่องสนับสนุน (SVM) เป็นอัลกอริธึมบางส่วนที่ใช้

ตัวอย่างของแมชชีนเลิร์นนิงที่ไม่มีผู้ดูแล

ดังที่ได้กล่าวไว้ก่อนหน้านี้ การเรียนรู้โดยไม่ได้รับการดูแลสามารถเป็นเป้าหมายในตัวเอง และสามารถใช้เพื่อค้นหารูปแบบที่ซ่อนอยู่ในข้อมูลปริมาณมหาศาล ซึ่งเป็นงานที่ไม่สมจริงสำหรับมนุษย์

การใช้งานจริงของแมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล

  • การตรวจจับความผิดปกติ: เป็นกระบวนการในการค้นหาจุดข้อมูลที่ผิดปกติในชุดข้อมูล ดังนั้นจึงมีประโยชน์สำหรับการตรวจจับกิจกรรมที่เป็นการฉ้อโกง
  • คอมพิวเตอร์วิทัศน์: ยังเป็นที่รู้จักกันในนาม   การจดจำภาพ ความสามารถในการระบุวัตถุในภาพเป็นสิ่งจำเป็นสำหรับรถยนต์ที่ขับด้วยตนเอง และมีคุณค่าสำหรับอุตสาหกรรมการดูแลสุขภาพสำหรับการแบ่งส่วนภาพ
  • ระบบคำแนะนำ: โดยการวิเคราะห์ข้อมูลในอดีต อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลจะแนะนำผลิตภัณฑ์ที่ลูกค้ามีแนวโน้มว่าจะซื้อมากที่สุด
  • บุคลิกของลูกค้า: การเรียนรู้โดยไม่ได้รับการดูแลสามารถช่วยให้ธุรกิจสร้างตัวตนของลูกค้าได้อย่างแม่นยำโดยการวิเคราะห์ข้อมูลเกี่ยวกับพฤติกรรมการซื้อ

ออกจากอัลกอริทึมไปยังอุปกรณ์ของตัวเอง

ความสามารถในการเรียนรู้ด้วยตัวเองทำให้การเรียนรู้แบบไม่มีผู้ดูแลเป็นวิธีที่เร็วที่สุดในการวิเคราะห์ข้อมูลปริมาณมหาศาล แน่นอน การเลือกระหว่างการเรียนรู้ภายใต้การดูแลหรือไม่ได้รับการดูแล (หรือแม้แต่กึ่งควบคุมดูแล) นั้นขึ้นอยู่กับปัญหาที่คุณพยายามแก้ไข และเวลาและความกว้างของข้อมูลที่มี อย่างไรก็ตาม การเรียนรู้แบบไม่มีผู้ดูแลสามารถทำให้ความพยายามทั้งหมดของคุณปรับขนาดได้มากขึ้น

AI ที่เรามีทุกวันนี้ไม่สามารถครอบงำโลกได้ นับประสาไม่เชื่อฟังคำสั่งของผู้สร้าง แต่มันทำให้การทำงานที่เหลือเชื่ออย่างรถยนต์ไร้คนขับและแชทบ็อตเป็นไปได้ เรียกว่า AI แบบแคบ แต่ไม่อ่อนแออย่างที่คิด