Unsupervised Learning: วิธีการที่เครื่องเรียนรู้ด้วยตัวเอง
เผยแพร่แล้ว: 2021-03-19การเรียนรู้แบบไม่มีผู้ดูแลช่วยให้เครื่องเรียนรู้ด้วยตนเอง
แมชชีนเลิร์นนิง (ML) ประเภทนี้ช่วยให้แอปพลิเคชัน AI สามารถเรียนรู้และค้นหารูปแบบที่ซ่อนอยู่ในชุดข้อมูลขนาดใหญ่โดยไม่ต้องมีมนุษย์ควบคุม การเรียนรู้โดยไม่ได้รับการดูแลก็มีความสำคัญต่อการบรรลุเช่นกัน ปัญญาประดิษฐ์ทั่วไป
ข้อมูลการติดฉลากต้องใช้แรงงานจำนวนมากและใช้เวลานาน และในหลายกรณีก็ไม่สามารถทำได้ นั่นคือจุดที่การเรียนรู้แบบไม่มีผู้ดูแลทำให้เกิดความแตกต่างอย่างมากโดยให้แอปพลิเคชัน AI สามารถเรียนรู้ได้โดยไม่ต้องมีป้ายกำกับและการควบคุมดูแล
การเรียนรู้แบบไม่มีผู้ดูแลคืออะไร?
Unsupervised Learning (UL) เป็นเทคนิคการเรียนรู้ของเครื่องที่ใช้ในการระบุรูปแบบในชุดข้อมูลที่มีจุดข้อมูลที่ไม่จัดประเภทและไม่มีป้ายกำกับ ในวิธีการเรียนรู้นี้ ระบบ AI จะได้รับเฉพาะข้อมูลอินพุตและไม่มีข้อมูลเอาต์พุตที่เกี่ยวข้อง
ไม่เหมือนกับ การเรียนรู้ภายใต้การ ดูแล แมชชีนเลิร์นนิงแบบไม่อยู่ภายใต้การดูแลไม่ต้องการให้มนุษย์ดูแลโมเดล นักวิทยาศาสตร์ข้อมูลช่วยให้เครื่องเรียนรู้โดยการสังเกตข้อมูลและค้นหารูปแบบด้วยตัวเอง กล่าวอีกนัยหนึ่งหมวดหมู่ย่อยของการเรียนรู้ด้วยเครื่องนี้ช่วยให้ระบบสามารถดำเนินการกับข้อมูลที่กำหนดโดยไม่มีคำแนะนำจากภายนอก
เทคนิคการเรียนรู้โดยไม่ได้รับการดูแลเป็นสิ่งสำคัญสำหรับการสร้างระบบปัญญาประดิษฐ์ด้วยปัญญาของมนุษย์ นั่นเป็นเพราะว่าเครื่องจักรอัจฉริยะจะต้องสามารถตัดสินใจ (เป็นอิสระ) ได้โดยการวิเคราะห์ข้อมูลที่ไม่ได้ติดแท็กปริมาณมาก
เมื่อเทียบกับอัลกอริธึมการเรียนรู้ภายใต้การดูแล อัลกอริธึม UL เชี่ยวชาญในการทำงานที่ซับซ้อนมากกว่า อย่างไรก็ตาม โมเดลการเรียนรู้ภายใต้การดูแลจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น เนื่องจากผู้สอนบอกระบบอย่างชัดเจนว่าต้องค้นหาอะไรในข้อมูลที่กำหนด แต่ในกรณีของการเรียนรู้แบบ unsupervised สิ่งต่าง ๆ ค่อนข้างคาดเดาไม่ได้
โครงข่ายประสาทเทียมซึ่งทำให้ การเรียนรู้อย่างลึกซึ้ง ความเป็นจริง อาจดูเหมือนได้รับการสนับสนุนจากการเรียนรู้แบบไม่มีผู้ดูแล แม้ว่าจะเป็นความจริง แต่อัลกอริธึมการเรียนรู้ของโครงข่ายประสาทเทียมยังสามารถดูแลได้หากทราบผลลัพธ์ที่ต้องการแล้ว
การเรียนรู้โดยไม่ได้รับการดูแลสามารถเป็นเป้าหมายในตัวเองได้ ตัวอย่างเช่น สามารถใช้โมเดล UL เพื่อค้นหารูปแบบที่ซ่อนอยู่ในข้อมูลปริมาณมหาศาล และแม้กระทั่งสำหรับการจัดประเภทและติดป้ายกำกับจุดข้อมูล การจัดกลุ่มจุดข้อมูลที่ไม่เรียงลำดับจะดำเนินการโดยการระบุความเหมือนและความแตกต่าง
เหตุผลบางประการที่การเรียนรู้โดยไม่ได้รับการดูแลเป็นสิ่งสำคัญ
- ข้อมูลที่ไม่มีป้ายกำกับมีมากมาย
- การติดฉลากข้อมูลเป็นงานที่น่าเบื่อซึ่งต้องใช้แรงงานคน อย่างไรก็ตาม กระบวนการนี้สามารถขับเคลื่อนด้วย ML ได้ ทำให้การติดฉลากง่ายขึ้นสำหรับมนุษย์ที่เกี่ยวข้อง
- มีประโยชน์สำหรับการสำรวจข้อมูลที่ไม่รู้จักและข้อมูลดิบ
- มีประโยชน์สำหรับการดำเนินการจดจำรูปแบบในชุดข้อมูลขนาดใหญ่
การเรียนรู้แบบไม่มีผู้ดูแลทำงานอย่างไร
พูดง่ายๆ ก็คือ การเรียนรู้ที่ไม่มีผู้ดูแลทำงานโดยการวิเคราะห์ข้อมูลที่ไม่มีหมวดหมู่ ไม่มีป้ายกำกับ และค้นหาโครงสร้างที่ซ่อนอยู่ในนั้น
ในการเรียนรู้ภายใต้การดูแล นักวิทยาศาสตร์ข้อมูลจะป้อนข้อมูลระบบด้วยข้อมูลที่มีป้ายกำกับ เช่น รูปภาพของแมวที่ติดป้ายกำกับว่าเป็นแมว เพื่อให้สามารถเรียนรู้ได้จากตัวอย่าง ในการเรียนรู้โดยไม่ได้รับการดูแล นักวิทยาศาสตร์ด้านข้อมูลจะจัดเตรียมแค่ภาพถ่ายเท่านั้น และเป็นความรับผิดชอบของระบบในการวิเคราะห์ข้อมูลและสรุปว่าเป็นรูปแมวหรือไม่
แมชชีนเลิร์นนิงที่ไม่ได้รับการดูแลต้องการข้อมูลปริมาณมหาศาล ในกรณีส่วนใหญ่ การเรียนรู้ภายใต้การดูแลก็เช่นเดียวกัน เนื่องจากโมเดลมีความแม่นยำมากขึ้นพร้อมตัวอย่างมากขึ้น
กระบวนการของการเรียนรู้โดยไม่ได้รับการดูแลเริ่มต้นด้วยนักวิทยาศาสตร์ข้อมูลฝึกอัลกอริทึมโดยใช้ชุดข้อมูลการฝึกอบรม จุดข้อมูลในชุดข้อมูลเหล่านี้ไม่มีป้ายกำกับและไม่มีการจัดหมวดหมู่
เป้าหมายการเรียนรู้ของอัลกอริทึมคือการระบุรูปแบบภายในชุดข้อมูลและจัดหมวดหมู่จุดข้อมูลตามรูปแบบที่ระบุเหมือนกัน ในตัวอย่างของภาพแมว อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลสามารถเรียนรู้ที่จะระบุลักษณะเฉพาะของแมว เช่น หนวด หางยาว และกรงเล็บที่หดได้
หากคุณลองคิดดู การเรียนรู้โดยไม่ได้รับการดูแลคือวิธีที่เราเรียนรู้ที่จะระบุและจัดหมวดหมู่สิ่งต่างๆ สมมติว่าคุณไม่เคยชิมซอสมะเขือเทศหรือซอสพริก หากคุณได้รับซอสมะเขือเทศและซอสพริกที่ "ไม่มีป้ายกำกับ" สองขวด และขอให้ลองชิม คุณจะสามารถแยกความแตกต่างระหว่างรสชาติได้
คุณยังสามารถระบุลักษณะเฉพาะของซอสทั้งสองชนิดได้ (อันหนึ่งเปรี้ยวและอีกอันเผ็ด) แม้ว่าคุณจะไม่รู้จักชื่อซอสทั้งสองชนิด การชิมแต่ละครั้งอีกสองสามครั้งจะทำให้คุณคุ้นเคยกับรสชาติมากขึ้น ในไม่ช้า คุณจะสามารถจัดกลุ่มอาหารตามซอสที่เติมเพียงแค่ชิม
เมื่อวิเคราะห์รสชาติแล้ว คุณจะพบคุณลักษณะเฉพาะที่ทำให้ซอสทั้งสองชนิดและอาหารจานกลุ่มแตกต่างกัน คุณไม่จำเป็นต้องรู้ชื่อซอสหรือชื่ออาหารเพื่อจัดหมวดหมู่ คุณอาจจะเรียก ซอสหวานและซอส ร้อน อื่นๆ
ซึ่งคล้ายกับวิธีที่เครื่องระบุรูปแบบและจัดประเภทจุดข้อมูลด้วยความช่วยเหลือของการเรียนรู้แบบไม่มีผู้ดูแล ในตัวอย่างเดียวกัน การเรียนรู้ภายใต้การดูแลจะเป็นคนที่บอกคุณถึงชื่อของซอสทั้งสองชนิดและรสชาติของซอสล่วงหน้า
ประเภทของการเรียนรู้แบบไม่มีผู้ดูแล
ปัญหาการเรียนรู้ที่ไม่ได้รับการดูแลสามารถจำแนกได้เป็นปัญหาการจัด กลุ่ม และการ เชื่อมโยง
การจัดกลุ่ม
คลัสเตอร์หรือการวิเคราะห์คลัสเตอร์เป็นกระบวนการของการจัดกลุ่มออบเจ็กต์เป็นกลุ่ม รายการที่มีความคล้ายคลึงกันมากที่สุดจะถูกจัดกลุ่มไว้ด้วยกัน ในขณะที่รายการที่เหลือจะจัดอยู่ในกลุ่มอื่นๆ ตัวอย่างของการจัดกลุ่มคือการจัดกลุ่มผู้ใช้ YouTube ตามประวัติการดูของพวกเขา
ขึ้นอยู่กับวิธีการทำงาน การจัดกลุ่มสามารถแบ่งออกเป็นสี่กลุ่มดังนี้:
- การทำ คลัสเตอร์แบบเอกสิทธิ์เฉพาะบุคคล: ตามชื่อที่แนะนำ การทำคลัสเตอร์แบบเอกสิทธิ์เฉพาะบุคคลระบุว่าจุดข้อมูลหรืออ็อบเจ็กต์สามารถมีอยู่ในคลัสเตอร์เดียวเท่านั้น
- การ จัดกลุ่มตามลำดับชั้น: ลำดับชั้นพยายามสร้างลำดับชั้นของคลัสเตอร์ การจัดกลุ่มตามลำดับชั้นมีสองประเภท: agglomerative และ divivive Agglomerative เป็นไปตามแนวทางจากล่างขึ้นบน โดยเริ่มแรกถือว่าแต่ละจุดข้อมูลเป็นคลัสเตอร์เดี่ยว และคู่ของคลัสเตอร์จะรวมกันเมื่อเลื่อนขึ้นลำดับชั้น การแตกแยกเป็นสิ่งที่ตรงกันข้ามกับการรวมตัวกัน จุดข้อมูลทุกจุดเริ่มต้นในคลัสเตอร์เดียวและแยกส่วนเมื่อย้ายลงลำดับชั้น
- การทำ คลัสเตอร์ที่ทับซ้อนกัน: การทับซ้อนกันช่วยให้สามารถจัดกลุ่มจุดข้อมูลเป็นคลัสเตอร์ตั้งแต่สองคลัสเตอร์ขึ้นไป
- การ จัดกลุ่มความน่าจะเป็น: ความน่าจะเป็นใช้การแจกแจงความน่าจะเป็นเพื่อสร้างคลัสเตอร์ ตัวอย่างเช่น "ถุงเท้าสีเขียว" "ถุงเท้าสีน้ำเงิน" "เสื้อยืดสีเขียว" และ "เสื้อยืดสีน้ำเงิน" สามารถจัดกลุ่มเป็น 2 ประเภทคือ "สีเขียว" และ "สีน้ำเงิน" หรือ "ถุงเท้า" และ "เสื้อยืด" ".
สมาคม
การเรียนรู้กฎการเชื่อมโยง (ARL) เป็นวิธีการเรียนรู้แบบไม่มีผู้ดูแลที่ใช้เพื่อค้นหาความสัมพันธ์ระหว่างตัวแปรในฐานข้อมูลขนาดใหญ่ ไม่เหมือนกับอัลกอริธึมการเรียนรู้ของเครื่องบางตัว ARL สามารถจัดการจุดข้อมูลที่ไม่ใช่ตัวเลขได้
ในแง่ที่ง่ายกว่า ARL คือการค้นหาว่าตัวแปรบางตัวเชื่อมโยงกันอย่างไร ตัวอย่างเช่น คนที่ซื้อมอเตอร์ไซค์มักจะซื้อหมวกกันน็อค
การค้นหาความสัมพันธ์ดังกล่าวสามารถทำกำไรได้ ตัวอย่างเช่น หากลูกค้าที่ซื้อ Product X มักจะซื้อ Product Y ผู้ค้าปลีกออนไลน์สามารถแนะนำ Product Y ให้กับทุกคนที่ซื้อ Product X
การเรียนรู้กฎของสมาคมใช้คำสั่ง if/then เป็นหลัก ข้อความเหล่านี้สามารถเปิดเผยความสัมพันธ์ระหว่างข้อมูลอิสระ นอกจากนี้ สังเกตรูปแบบ if/then หรือความสัมพันธ์โดยใช้ การสนับสนุน และ ความมั่นใจ
ฝ่ายสนับสนุนระบุความถี่ที่ความสัมพันธ์แบบ if/then ปรากฏในฐานข้อมูล ความเชื่อมั่นกำหนดจำนวนครั้งที่พบว่าความสัมพันธ์แบบ if/then นั้นถูกต้อง
การวิเคราะห์ตะกร้าตลาด และ การขุดการใช้เว็บ เป็นไปได้ด้วยกฎสมาคม
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแล
การเรียนรู้กฎการจัดกลุ่มและการเชื่อมโยงนั้นดำเนินการโดยใช้อัลกอริทึม
อัลกอริธึม Apriori, อัลกอริธึม ECLAT และอัลกอริธึมการขยายรูปแบบความถี่ (FP) เป็นอัลกอริธึมที่โดดเด่นบางส่วนที่ใช้ในการนำกฎการเชื่อมโยงไปใช้ การทำคลัสเตอร์ทำได้โดยอัลกอริทึม เช่น การจัดกลุ่ม k-mean และการวิเคราะห์องค์ประกอบหลัก (PCA)

อัลกอริทึม Apriori
อัลกอริทึม Apriori สร้างขึ้นสำหรับการขุดข้อมูล มีประโยชน์สำหรับฐานข้อมูลการขุดที่มีธุรกรรมจำนวนมาก เช่น ฐานข้อมูลที่มีรายการสินค้าที่ผู้ซื้อในซูเปอร์มาร์เก็ตซื้อ ใช้สำหรับระบุผลกระทบที่เป็นอันตรายของยาและในการวิเคราะห์ตะกร้าตลาดเพื่อค้นหาชุดของรายการที่ลูกค้ามีแนวโน้มที่จะซื้อร่วมกัน
อัลกอริทึม ECLAT
Equivalence Class Clustering และ Lattice Traversal จากล่างขึ้น บน หรือเรียกสั้นๆ ว่า ECLAT เป็นอัลกอริธึมการทำเหมืองข้อมูลที่ใช้เพื่อให้เกิดการขุด itemset และค้นหารายการที่พบบ่อย
อัลกอริทึม Apriori ใช้รูปแบบข้อมูลแนวนอน ดังนั้นจำเป็นต้องสแกนฐานข้อมูลหลายครั้งเพื่อระบุรายการที่ใช้บ่อย ในทางกลับกัน ECLAT ใช้วิธีแนวตั้งและโดยทั่วไปจะเร็วกว่า เนื่องจากจำเป็นต้องสแกนฐานข้อมูลเพียงครั้งเดียว
อัลกอริธึมการเติบโตของรูปแบบบ่อย (FP)
อัลกอริธึมการเติบโตรูปแบบบ่อย (FP) เป็นอัลกอริธึม Apriori รุ่นปรับปรุง อัลกอริธึมนี้แสดงฐานข้อมูลในรูปแบบของโครงสร้างต้นไม้ที่เรียกว่า ต้นไม้ หรือ รูปแบบ ที่ใช้บ่อย
ต้นไม้ที่ใช้บ่อยดังกล่าวใช้สำหรับขุดรูปแบบที่พบบ่อยที่สุด ในขณะที่อัลกอริทึม Apriori จำเป็นต้องสแกนฐานข้อมูล n+1 ครั้ง (โดยที่ n คือความยาวของโมเดลที่ยาวที่สุด) อัลกอริทึม FP-growth ต้องการการสแกนเพียงสองครั้ง
K-หมายถึงการจัดกลุ่ม
การทำซ้ำหลายครั้งของอัลกอริทึม k-mean มีการใช้กันอย่างแพร่หลายในด้านวิทยาศาสตร์ข้อมูล พูดง่ายๆ ก็คือ อัลกอริทึมการจัดกลุ่ม k-mean จะจัดกลุ่มรายการที่คล้ายคลึงกันเป็นคลัสเตอร์ จำนวนคลัสเตอร์แสดงด้วย k ดังนั้นหากค่าของ k เป็น 3 จะมีทั้งหมดสามกลุ่ม
วิธีการจัดกลุ่มนี้จะแบ่งชุดข้อมูลที่ไม่มีป้ายกำกับ เพื่อให้แต่ละจุดข้อมูลอยู่ในกลุ่มเดียวที่มีคุณสมบัติคล้ายคลึงกัน กุญแจสำคัญคือการหา K centers ที่เรียกว่า คลัสเตอร์ centroids
แต่ละคลัสเตอร์จะมีคลัสเตอร์เซนทรอยด์หนึ่งอัน และเมื่อเห็นจุดข้อมูลใหม่ อัลกอริธึมจะกำหนดคลัสเตอร์ที่ใกล้ที่สุดที่จุดข้อมูลอยู่ตามเมตริก เช่น ระยะทางแบบยุคลิด
การวิเคราะห์องค์ประกอบหลัก (PCA)
การ วิเคราะห์องค์ประกอบหลัก (PCA) เป็นวิธีการลดมิติซึ่งโดยทั่วไปจะใช้เพื่อลดมิติของชุดข้อมูลขนาดใหญ่ โดยแปลงตัวแปรจำนวนมากเป็นตัวแปรที่เล็กกว่าซึ่งมีข้อมูลเกือบทั้งหมดในชุดข้อมูลขนาดใหญ่
การลดจำนวนตัวแปรอาจส่งผลต่อความแม่นยำเล็กน้อย แต่อาจเป็นการแลกเปลี่ยนที่ยอมรับได้สำหรับความเรียบง่าย นั่นเป็นเพราะว่าชุดข้อมูลที่เล็กกว่านั้นวิเคราะห์ได้ง่ายกว่า และอัลกอริธึมการเรียนรู้ของเครื่องไม่ต้องทำงานหนักมากเพื่อให้ได้มาซึ่งข้อมูลเชิงลึกอันมีค่า
การเรียนรู้แบบมีผู้ดูแล vs. การเรียนรู้แบบไม่มีผู้ดูแล
การเรียนรู้ภายใต้การดูแลนั้นคล้ายกับการให้ครูดูแลกระบวนการเรียนรู้ทั้งหมด นอกจากนี้ยังมีชุดข้อมูลการฝึกอบรมที่มีป้ายกำกับซึ่งคล้ายกับการมีคำตอบที่ถูกต้องสำหรับแต่ละปัญหาที่คุณกำลังพยายามแก้ไข
ง่ายกว่าที่จะเข้าใจว่าคำตอบของคุณถูกต้องหรือไม่ และครูจะแก้ไขให้คุณเมื่อคุณทำผิดพลาด ในกรณีของการเรียนรู้แบบไม่มีผู้ดูแล ไม่มีครูหรือคำตอบที่ถูกต้อง
จากมุมมองของการคำนวณ การเรียนรู้แบบไม่มีผู้ดูแลจะซับซ้อนและใช้เวลานานกว่าการเรียนรู้ภายใต้การดูแล อย่างไรก็ตาม มันมีประโยชน์สำหรับการขุดข้อมูลและเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับโครงสร้างของข้อมูลก่อนที่จะกำหนดตัว แยกประเภท ใดๆ (อัลกอริธึมการเรียนรู้ของเครื่องที่จัดประเภทข้อมูลโดยอัตโนมัติ)
แม้จะมีประโยชน์เมื่อข้อมูลที่ไม่มีป้ายกำกับนั้นมีขนาดใหญ่มาก แต่การเรียนรู้โดยไม่ได้รับการดูแลก็อาจทำให้นักวิทยาศาสตร์ข้อมูลไม่สะดวกเพียงเล็กน้อย เนื่องจากชุดข้อมูลการตรวจสอบความถูกต้องที่ใช้ในการเรียนรู้ภายใต้การดูแลยังมีการกำกับไว้ด้วย นักวิทยาศาสตร์ข้อมูลจึงวัดความแม่นยำของแบบจำลองได้ง่ายขึ้น แต่สิ่งเดียวกันนี้ไม่เป็นความจริงสำหรับรูปแบบการเรียนรู้ที่ไม่มีผู้ดูแล
ในหลายกรณี การเรียนรู้แบบไม่มีผู้ดูแลจะถูกนำมาใช้ก่อนการเรียนรู้ภายใต้การดูแล ซึ่งจะช่วยในการระบุคุณลักษณะและสร้างชั้นเรียน
กระบวนการเรียนรู้แบบไม่มีผู้ดูแลเกิดขึ้นทางออนไลน์ ในขณะที่การเรียนรู้ภายใต้การดูแลเกิดขึ้นแบบออฟไลน์ ซึ่งช่วยให้อัลกอริธึม UL สามารถประมวลผลข้อมูลได้แบบเรียลไทม์
ในขณะที่ปัญหาการเรียนรู้ที่ไม่ได้รับการดูแลจะแบ่งออกเป็นปัญหาความสัมพันธ์และการจัดกลุ่ม การเรียนรู้ภายใต้การดูแลสามารถจัดประเภทเพิ่มเติมได้เป็นการถดถอยและการจำแนก
นอกเหนือจากการเรียนรู้ภายใต้การดูแลและการเรียนรู้แบบไม่มีผู้ดูแลแล้ว ยังมีการเรียนรู้ แบบกึ่งควบคุม และ การเรียนรู้แบบเสริมกำลัง
การเรียนรู้แบบกึ่งควบคุมดูแลเป็นการผสมผสานระหว่างการเรียนรู้ แบบมีผู้สอนและแบบไม่มีผู้ดูแล ในเทคนิคแมชชีนเลิร์นนิงนี้ ระบบได้รับการฝึกอบรมเพียงเล็กน้อยเพื่อให้ได้รับภาพรวมในระดับสูง ส่วนหนึ่งของข้อมูลการฝึกอบรมจะถูกติดป้ายกำกับ และส่วนที่เหลือจะไม่มีป้ายกำกับ
ใน การเรียนรู้การเสริมแรง (RL) ระบบปัญญาประดิษฐ์จะพบกับสภาพแวดล้อมที่เหมือนเกมซึ่งจะต้องได้รับรางวัลสูงสุด ระบบต้องเรียนรู้โดยทำตามวิธีการลองผิดลองถูกและเพิ่มโอกาสในการได้รับรางวัลในแต่ละขั้นตอน
มาดูความแตกต่างที่สำคัญระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลโดยย่อ
การเรียนรู้แบบไม่มีผู้ดูแล | การเรียนรู้ภายใต้การดูแล |
เป็นกระบวนการที่ซับซ้อน ต้องใช้ทรัพยากรในการคำนวณมากขึ้นและใช้เวลานาน | ค่อนข้างง่ายและต้องใช้ทรัพยากรในการคำนวณน้อยลง |
ชุดข้อมูลการฝึกอบรมไม่มีป้ายกำกับ | มีป้ายกำกับชุดข้อมูลการฝึกอบรม |
แม่นยำน้อยกว่า แต่ไม่จำเป็น | แม่นยำสูง |
แบ่งออกเป็นสมาคมและคลัสเตอร์ | แบ่งออกเป็นการถดถอยและการจำแนกประเภท |
การวัดความแม่นยำของแบบจำลองควบคู่ไปกับความไม่แน่นอนนั้นเป็นเรื่องยุ่งยาก | การวัดความแม่นยำของแบบจำลองนั้นง่ายกว่า |
ไม่ทราบจำนวนคลาส | ทราบจำนวนคลาสแล้ว |
การเรียนรู้เกิดขึ้นแบบเรียลไทม์ | การเรียนรู้เกิดขึ้นแบบออฟไลน์ |
อัลกอริธึมการเติบโต Apriori, ECLAT, k-means clustering และ Frequent pattern (FP) คืออัลกอริธึมบางส่วนที่ใช้ | การถดถอยเชิงเส้น การถดถอยโลจิสติก อ่าวไร้เดียงสา และเวกเตอร์เครื่องสนับสนุน (SVM) เป็นอัลกอริธึมบางส่วนที่ใช้ |
ตัวอย่างของแมชชีนเลิร์นนิงที่ไม่มีผู้ดูแล
ดังที่ได้กล่าวไว้ก่อนหน้านี้ การเรียนรู้โดยไม่ได้รับการดูแลสามารถเป็นเป้าหมายในตัวเอง และสามารถใช้เพื่อค้นหารูปแบบที่ซ่อนอยู่ในข้อมูลปริมาณมหาศาล ซึ่งเป็นงานที่ไม่สมจริงสำหรับมนุษย์
การใช้งานจริงของแมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล
- การตรวจจับความผิดปกติ: เป็นกระบวนการในการค้นหาจุดข้อมูลที่ผิดปกติในชุดข้อมูล ดังนั้นจึงมีประโยชน์สำหรับการตรวจจับกิจกรรมที่เป็นการฉ้อโกง
- คอมพิวเตอร์วิทัศน์: ยังเป็นที่รู้จักกันในนาม การจดจำภาพ ความสามารถในการระบุวัตถุในภาพเป็นสิ่งจำเป็นสำหรับรถยนต์ที่ขับด้วยตนเอง และมีคุณค่าสำหรับอุตสาหกรรมการดูแลสุขภาพสำหรับการแบ่งส่วนภาพ
- ระบบคำแนะนำ: โดยการวิเคราะห์ข้อมูลในอดีต อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลจะแนะนำผลิตภัณฑ์ที่ลูกค้ามีแนวโน้มว่าจะซื้อมากที่สุด
- บุคลิกของลูกค้า: การเรียนรู้โดยไม่ได้รับการดูแลสามารถช่วยให้ธุรกิจสร้างตัวตนของลูกค้าได้อย่างแม่นยำโดยการวิเคราะห์ข้อมูลเกี่ยวกับพฤติกรรมการซื้อ
ออกจากอัลกอริทึมไปยังอุปกรณ์ของตัวเอง
ความสามารถในการเรียนรู้ด้วยตัวเองทำให้การเรียนรู้แบบไม่มีผู้ดูแลเป็นวิธีที่เร็วที่สุดในการวิเคราะห์ข้อมูลปริมาณมหาศาล แน่นอน การเลือกระหว่างการเรียนรู้ภายใต้การดูแลหรือไม่ได้รับการดูแล (หรือแม้แต่กึ่งควบคุมดูแล) นั้นขึ้นอยู่กับปัญหาที่คุณพยายามแก้ไข และเวลาและความกว้างของข้อมูลที่มี อย่างไรก็ตาม การเรียนรู้แบบไม่มีผู้ดูแลสามารถทำให้ความพยายามทั้งหมดของคุณปรับขนาดได้มากขึ้น
AI ที่เรามีทุกวันนี้ไม่สามารถครอบงำโลกได้ นับประสาไม่เชื่อฟังคำสั่งของผู้สร้าง แต่มันทำให้การทำงานที่เหลือเชื่ออย่างรถยนต์ไร้คนขับและแชทบ็อตเป็นไปได้ เรียกว่า AI แบบแคบ แต่ไม่อ่อนแออย่างที่คิด