สิ่งที่คุณต้องรู้เกี่ยวกับแมชชีนเลิร์นนิง [สัมภาษณ์นักวิทยาศาสตร์ข้อมูล]
เผยแพร่แล้ว: 2022-05-25ไซไฟได้วาดภาพสยองขวัญมากมายเกี่ยวกับอนาคตของเครื่องจักรที่จะครองโลก วิสัยทัศน์อันน่าสยดสยองของเครื่องจักรอันทรงพลังเหล่านี้เป็นความเข้าใจผิดบางประการที่ผู้คนมีเกี่ยวกับ AI และการเรียนรู้ของเครื่อง
ในบทความนี้ ผู้เชี่ยวชาญด้าน Machine Learning Juuso Lassila ตอบคำถามที่พบบ่อยที่สุดเกี่ยวกับการเรียนรู้ของเครื่อง และบอกเราว่าเหตุใดเครื่องจักรจึงไม่พร้อมที่จะครองโลก
1. แมชชีนเลิร์นนิงคืออะไร?
การเรียนรู้ของเครื่องหมายความว่าเครื่องสามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรม แมชชีนเลิร์นนิงและ AI มักถูกใช้เป็นคำพ้องความหมายอย่างผิด ๆ แต่ก็ไม่เหมือนกัน การเรียนรู้ของเครื่องเป็นส่วนย่อยของ AI
“AI เป็นคำที่นิยามได้ไม่ดีนัก มันมีความหมายอะไรก็ได้” ลาสศิลาอธิบาย
ความแตกต่างที่สำคัญระหว่างแมชชีนเลิร์นนิงและ AI คือ AI ไม่ต้องการข้อมูลเสมอไป ตัวอย่างเช่น บางคนบอกว่าการค้นหาเส้นทางที่เหมาะสมที่สุดบนแผนที่คือ AI กระบวนการนี้ไม่ได้อิงตามข้อมูล แต่เป็น อัลกอริทึม
ในทางกลับกัน แมชชีนเลิร์นนิงคือ AI ที่ใช้ข้อมูลในการเรียนรู้ ประโยชน์ของแมชชีนเลิร์นนิงคือโปรแกรมเมอร์ไม่จำเป็นต้องรู้ว่าตัวแบบแก้ปัญหาอย่างไร ซึ่งหมายความว่าเครื่องสามารถใช้เทคนิคที่โปรแกรมเมอร์ไม่ทราบได้ ทุกวันนี้ แมชชีนเลิร์นนิงมีบทบาทสำคัญในหลายอุตสาหกรรม
2. Machine Learning ใช้อย่างไร?
แมชชีนเลิร์นนิงพยายามทำความเข้าใจข้อมูลและโครงสร้างในนั้น พูดง่ายๆ ก็คือ มาดูสิ่งที่ชาวอินเทอร์เน็ตชื่นชอบกัน นั่นคือ รูปภาพของแมวและสุนัข! ดังนั้น หากคุณมีรูปภาพของเพื่อนขนฟูที่คุณชื่นชอบหลายร้อยรูปเรียงตามลำดับแบบสุ่ม คุณสามารถใช้การเรียนรู้ของเครื่องเพื่อแยกความแตกต่างระหว่างรูปภาพเหล่านี้ เครื่องสามารถจัดระเบียบข้อมูลเพื่อให้คุณลงเอยด้วยภาพแมวเท่านั้นเป็นต้น
"แมชชีนเลิร์นนิงจะทำนายค่าจากข้อมูลที่คุณป้อนและทำความเข้าใจกับข้อมูลนั้น" Lassila กล่าว
วิธีทั่วไปในการใช้แมชชีนเลิร์นนิงคือการจัดหมวดหมู่ข้อมูล เช่นในตัวอย่างของเราที่มีรูปภาพของแมวและสุนัขด้านบน อย่างไรก็ตาม แมชชีนเลิร์นนิงยังใช้ในแชทบอท AI และเพื่อคาดการณ์ประเภทต่างๆ ตัวอย่างเช่น สามารถใช้แมชชีนเลิร์นนิงเพื่อประเมินมูลค่าของบ้านตามขนาด ที่ตั้ง ปีที่สร้างจากข้อมูลอื่นๆ
3. เครื่องจักรเรียนรู้ได้อย่างไร?
การเรียนรู้ของเครื่องมักจะพยายามลดข้อผิดพลาดของแบบจำลองให้น้อยที่สุด อันดับแรก เริ่มต้นด้วยการสุ่มคำตอบ จากนั้นมนุษย์ก็ให้คำตอบที่ถูกต้อง Lassila อธิบาย
มีวิธีวัดว่าเครื่องผิดอย่างไรกับคำตอบที่ให้ไว้ ในบางโมเดลแมชชีนเลิร์นนิง การแยกความแตกต่างจะใช้เพื่อลดข้อผิดพลาดให้เหลือน้อยที่สุด
ด้วยการสร้างความแตกต่าง คุณสามารถคำนวณทิศทางที่ควรเปลี่ยนพารามิเตอร์ เพื่อลดค่าของฟังก์ชันข้อผิดพลาด
“จากนั้นคุณก็รู้วิธีเปลี่ยนพารามิเตอร์ของคุณเพื่อให้ค่าของฟังก์ชันลดลง จากนั้น ให้คุณก้าวไปสู่ข้อผิดพลาดเล็กๆ น้อยๆ ด้วยการเปลี่ยนพารามิเตอร์ ด้วยวิธีนี้คุณจะลดข้อผิดพลาดให้เหลือน้อยที่สุด” Lassila กล่าว
4. เครื่องจะปราศจากข้อผิดพลาดได้หรือไม่?
ในทางทฤษฎี เป็นไปได้ว่าไม่มีข้อผิดพลาด แต่ในโลกแห่งความเป็นจริง มันไม่ได้เกิดขึ้นจริง แม้แต่ในกรณีที่ดีที่สุด เครื่องก็สามารถรับข้อมูลที่ถูกต้องได้เพียง 99.9% เท่านั้น
“สำหรับการจำแนกประเภท เราสามารถวัดความแม่นยำได้” Lassila กล่าว โดยปกติความแม่นยำ 90-95% ถือว่าค่อนข้างดี เมื่อระยะขอบของข้อผิดพลาดต่ำเพียงพอ เครื่องก็พร้อมที่จะเข้าสู่การผลิต ระยะขอบของข้อผิดพลาดจะต้องต่ำเพียงใดก่อนที่ผลิตภัณฑ์จะสามารถทำงานจริงได้นั้นขึ้นอยู่กับงานที่เครื่องควรทำ
เมื่อพูดถึง AI chatbots เป็นเรื่องยากที่จะพูดว่าเมื่อใดที่บอทจะมีประโยชน์มากกว่าที่น่ารำคาญ เนื่องจากแชทบอทของ AI สามารถมีคำถามตัวอย่างได้มากเท่าที่เป็นไปได้ เครื่องต้องเลือกคำตอบที่ดีที่สุดเสมอ ความถูกต้องของเครื่องจะขึ้นอยู่กับจำนวนคำถามตัวอย่างที่มี
“หากคุณมีคำถามหนึ่งข้อ เครื่องจะถูกต้องเสมอ หากคุณมีสองข้อ หวังว่าจะถูกต้องบ่อยครั้ง แต่ถ้าคุณมีคำถาม 100 ข้อ เครื่องก็มักจะเลือกคำตอบที่ผิด” Lassila อธิบาย
5. การเรียนรู้อย่างลึกซึ้งคืออะไร?
การเรียนรู้เชิงลึก เป็นวิธีการเรียนรู้ของเครื่องที่ใช้เลเยอร์ในแบบจำลอง หนึ่งเลเยอร์สร้างเอาต์พุตและเอาต์พุตนั้นจะถูกถ่ายโอนไปยังเลเยอร์ที่สองเป็นต้น การเรียนรู้เชิงลึกมักจะทำใน โครงข่ายประสาทเทียม
"โครงข่ายประสาทเทียมมีประโยชน์มากเพราะสามารถปรับให้เข้ากับรูปแบบอินพุตและเอาต์พุตที่แตกต่างกันได้ดี" Lassila กล่าว
โครงข่ายประสาทเทียมนั้นใช้งานได้หลากหลายมาก และด้วยเหตุนี้จึงมีกรณีการใช้งานมากมาย AI chatbots มักใช้โครงข่ายประสาทเทียมเช่นกัน
“เราสร้างประโยคที่ฝังจากข้อความซึ่งเป็นเพียงจุดเวกเตอร์ในอวกาศ จากนั้นเราวัดความคล้ายคลึงกัน มันใช้โครงข่ายประสาทเทียม มีเลเยอร์จำนวนมากและให้ผลลัพธ์ในตอนท้าย” Lassila อธิบาย
นอกจากนี้ยังมีวิธีการเรียนรู้ของเครื่องอีกมากมายที่ไม่ลึกซึ้ง เช่น เครื่องสนับสนุนเวกเตอร์ หรือ ต้นไม้ตัดสินใจ
6. อะไรคือคอขวดของแมชชีนเลิร์นนิง?
ข้อมูลเป็นหนึ่งในปัจจัยที่ทำให้เกิดข้อจำกัดในการเรียนรู้ของเครื่อง หากคุณไม่มีข้อมูล การเรียนรู้ของเครื่องจะไม่ทำงาน คุณต้องใช้ทรัพยากรในการคำนวณด้วย บ่อยครั้งที่โมเดลทำให้เกิดข้อ จำกัด เช่นกัน

“สำหรับงานพื้นฐาน เช่น การจำแนก แบบจำลองนั้นดี และในกรณีเหล่านั้น คุณถูกจำกัดด้วยข้อมูลและทรัพยากรในการคำนวณ แต่ในบางโดเมน โมเดลยังไม่ค่อยดีนัก” Lassila กล่าว
ยิ่งมีข้อมูลมาก ยิ่งดี ตราบใดที่คุณมีทรัพยากรในการคำนวณข้อมูลนั้น แต่ข้อมูลจะต้องมีคุณภาพดี นอกจากนี้ โมเดลจะต้องมีขนาดใหญ่เพื่อให้โมเดลสามารถรองรับอินพุตที่ซับซ้อนทั้งหมดได้ คุณต้องการพลังการประมวลผลจำนวนมากเพื่อให้เครื่องจัดการข้อมูลนั้นได้
“คุณสามารถเข้าถึงข้อมูลจำนวนมากได้ นั่นไม่ใช่ปัญหาจริงๆ” ลาสศิลากล่าว “ปัญหาอยู่ที่ตัวแบบและเวลาในการฝึกฝน จำเป็นต้องใช้หน่วยความจำจำนวนมากในการจัดเก็บโมเดลเหล่านี้”
ข้อผิดพลาดอีกประการหนึ่งของแมชชีนเลิร์นนิงคือสถาปัตยกรรมแบบจำลองที่มีอยู่ในปัจจุบันสำหรับงานบางอย่าง ไม่มีสถาปัตยกรรมแบบจำลองที่ดีสำหรับการฝังประโยคในขณะนี้
“ยังคงเป็นการวิจัยอย่างต่อเนื่องเพื่อค้นหาแบบจำลองที่ดีจริงๆ” Lassila กล่าว
7. คุณสอนเครื่องจักรอย่างไร?
ก่อนอื่น คุณต้องมีข้อมูลจำนวนมาก และข้อมูลที่คุณใช้ฝึกโมเดลจำเป็นต้องมีป้ายกำกับของมนุษย์
“บริษัทใหญ่ๆ ที่ใช้แมชชีนเลิร์นนิงมีกลุ่มคนที่ติดป้ายกำกับข้อมูล” Lassila อธิบาย
แม้ว่าบอทสามารถเริ่มติดป้ายกำกับข้อมูลตามเวลาได้ แต่คุณไม่ต้องการใช้คำตอบที่แบบจำลองให้ไว้เป็นข้อมูลการฝึก โมเดลสร้างข้อผิดพลาดมากกว่ามนุษย์ หากคุณใช้การติดฉลากเครื่องเป็นข้อมูลการฝึก คุณจะสอนข้อผิดพลาดเหล่านั้นอีกครั้งกับรุ่น
“นั่นจะทำให้ข้อผิดพลาดเพิ่มมากขึ้นเรื่อย ๆ “
นอกจากนี้ยังสามารถใช้ การเรียนรู้เชิงรุก โดยที่ตัวแบบสามารถบอกได้ว่าจุดข้อมูลประเภทใดจะเป็นประโยชน์ในการติดป้ายกำกับ ซึ่งจะทำให้การเรียนรู้มีประสิทธิภาพมากขึ้น “เครื่องสามารถแนะนำกระบวนการติดฉลากได้ อย่างไรก็ตาม มนุษย์ควรทำฉลากเพื่อไม่ให้เกิดข้อผิดพลาด “
เมื่อมนุษย์ได้ฝึกโมเดลที่มีข้อมูลแล้ว เครื่องควรจะสามารถทำซ้ำการติดฉลากนั้นสำหรับอินพุตที่มองไม่เห็นได้ แต่ถ้าคุณต้องการคำตอบใหม่ มนุษย์ก็ต้องติดป้ายกำกับข้อมูลอีกครั้ง
8. แมชชีนเลิร์นนิงในอนาคตจะเป็นอย่างไร
การเรียนรู้ของเครื่องกำลังพัฒนาอย่างรวดเร็วในขณะนี้ ไม่กี่ปีที่ผ่านมามีการแนะนำโมเดลการเรียนรู้เชิงลึกอีกรุ่นหนึ่งคือรุ่นหม้อแปลงไฟฟ้า การค้นพบโมเดลหม้อแปลงไฟฟ้า มีผลกระทบอย่างมากต่อการเรียนรู้ของเครื่อง
“เราได้สร้างสาขาการวิจัยขึ้นมาใหม่ทั้งหมดเกี่ยวกับการค้นพบนั้น มันได้ผลดีจริงๆ” ลาสศิลาอธิบาย
โมเดลหม้อแปลงยังใช้ในแชทบอท AI พร้อมการประมวลผลภาษาธรรมชาติ “แต่เมื่อถึงจุดหนึ่ง เราจะถึงจุดสิ้นสุดของถนนว่าเราสามารถใช้สถาปัตยกรรมนั้นได้ดีเพียงใด” Lassila กล่าว “หวังว่าเราจะพบสิ่งใหม่ๆ ที่ให้ผลลัพธ์ที่ดียิ่งขึ้นไปอีก”
9. เครื่องจักรจะครองโลกหรือไม่?
ผู้คนคาดหวังมากเกินไปหรือไม่เพียงพอจาก AI และการเรียนรู้ของเครื่อง
“การขาดความเข้าใจในความสามารถของ AI” Lassila กล่าว
ดังนั้นดูเหมือนว่าเครื่องจักรจะยังไม่ครองโลกเลยทีเดียว บอทมีอุปสรรคเล็กน้อยที่จะเอาชนะก่อนที่จะเกิดขึ้น
“แบบจำลองและสถาปัตยกรรมยังไม่มี เรามีข้อมูลและทรัพยากรในการคำนวณเพื่อสร้าง AI ที่ดี แต่เรายังคงต้องการสถาปัตยกรรมที่ดีเหล่านั้นเพื่อให้หุ่นยนต์เข้าครอบครอง”
แม้ว่า AI ยังไม่พร้อมที่จะครองโลก แต่ก็จะเข้ายึดครองบางงาน
“บางงานอาจถูกแทนที่ด้วย AI ในบางจุด งานเหล่านี้จะเป็นงานที่ซ้ำซากจำเจซึ่งไม่ต้องคิดมาก” ลาสศิลากล่าว
มีสองวิธีในการคิดว่า AI จะเปลี่ยนตลาดงานได้อย่างไร หนึ่งคือ AI เข้ามาแทนที่งาน แต่ก็สามารถปรับปรุงงานได้เช่นกัน สามารถทำงานร่วมกับมนุษย์ได้ ตัวอย่างที่ดีคือ แชท บอ ท ซึ่งสามารถเชื่อมต่อกับตัวแทนออนไลน์เมื่อไม่สามารถช่วยเหลือผู้เยี่ยมชมเว็บไซต์ได้
“AI สามารถปรับปรุงประสิทธิภาพได้หลายงาน”
อย่างไรก็ตาม คุณยังคงต้องการทรัพยากรบุคคลเพื่อต่อสู้กับความไม่ถูกต้อง AI ไม่ได้คิดเหมือนมนุษย์ มันใช้วิธีการต่างๆ และบางครั้งก็ไม่สมเหตุสมผลสำหรับเราว่าทำไมมันถึงแสดงบางอย่าง
“ปัญหาที่ใหญ่ที่สุดประการหนึ่งของ AI คือเครื่องไม่ได้อธิบายว่าทำไมมันถึงสร้างผลลัพธ์บางอย่าง มันอาจจะสมเหตุสมผลสำหรับโมเดล แต่ไม่ใช่สำหรับมนุษย์”
หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิงและ AI โปรดดู คู่มือแช ท บอต AI ของเรา