Convolutional Neural Networks (CNNs): บทนำ
เผยแพร่แล้ว: 2022-08-30Convolutional neural network เสนอวิธีที่ปรับขนาดได้มากขึ้นในการจำแนกวัตถุและงานการจำแนกรูปภาพ
มีความก้าวหน้ามากมายเกิดขึ้นในโลกของเทคโนโลยี ปัญญาประดิษฐ์และแมชชีนเลิร์นนิงเป็นสิ่งที่คุณอาจได้ยินบ่อยๆ
ปัจจุบัน เทคโนโลยีเหล่านี้ถูกใช้ในเกือบทุกด้าน ตั้งแต่การตลาด อีคอมเมิร์ซ และการพัฒนาซอฟต์แวร์ ไปจนถึงการธนาคาร การเงิน และการแพทย์
AI และ ML เป็นสาขาที่กว้างใหญ่ และกำลังพยายามขยายการใช้งานเพื่อแก้ปัญหาในโลกแห่งความเป็นจริง นี่คือเหตุผลที่คุณสามารถมองเห็นสาขาต่างๆ มากมายในเทคโนโลยีเหล่านี้ ML เป็นเซตย่อยของ AI เอง
Convolutional Neural Network เป็นหนึ่งในสาขาของ AI ที่ได้รับความนิยมในทุกวันนี้
ในบทความนี้ ผมจะพูดถึงว่า CNN คืออะไร ทำงานอย่างไร และมีประโยชน์อย่างไรในโลกสมัยใหม่
มาดำดิ่งกัน!
โครงข่ายประสาท Convolutional คืออะไร?
Convolutional Neural Network (ConvNet หรือ CNN) คือเครือข่ายประสาทเทียม (ANN) ที่ใช้อัลกอริธึมการเรียนรู้เชิงลึกเพื่อวิเคราะห์ภาพ จำแนกภาพ และทำงานเกี่ยวกับการมองเห็นด้วยคอมพิวเตอร์

CNN ใช้ประโยชน์จากหลักการของพีชคณิตเชิงเส้น เช่น การคูณเมทริกซ์ เพื่อตรวจจับรูปแบบในรูปภาพ เนื่องจากกระบวนการเหล่านี้เกี่ยวข้องกับการคำนวณที่ซับซ้อน จึงจำเป็นต้องมีหน่วยประมวลผลกราฟิก (GPU) สำหรับการฝึกโมเดล
พูดง่ายๆ ก็คือ CNN ใช้อัลกอริธึม Deep Learning เพื่อนำข้อมูลที่ป้อนเข้ามา เช่น รูปภาพ และกำหนดความสำคัญในรูปแบบของอคติและน้ำหนักที่เรียนรู้ได้ในด้านต่างๆ ของภาพนั้น ด้วยวิธีนี้ CNN สามารถแยกความแตกต่างระหว่างรูปภาพหรือจำแนกได้
CNN's: ประวัติโดยย่อ
เนื่องจากโครงข่ายประสาทเทียมเป็นโครงข่ายประสาทเทียม การย้ำโครงข่ายประสาทเทียมจึงเป็นสิ่งสำคัญ
ในการคำนวณ โครงข่ายประสาทเทียมเป็นส่วนหนึ่งของการเรียนรู้ของเครื่อง (ML) โดยใช้อัลกอริธึมการเรียนรู้เชิงลึก คล้ายกับรูปแบบการเชื่อมต่อที่ตามมาด้วยเซลล์ประสาทในสมองของมนุษย์ โครงข่ายประสาทเทียมยังได้รับแรงบันดาลใจจากการจัดเรียงเยื่อหุ้มสมองด้วยภาพ

ดังนั้น โครงข่ายประสาทเทียมชนิดต่างๆ หรือโครงข่ายประสาทเทียม (ANN) จึงถูกนำมาใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน หนึ่งในนั้นคือ CNN ที่ใช้สำหรับการตรวจจับและจำแนกรูปภาพ และอื่นๆ ได้รับการแนะนำโดยนักวิจัยหลังปริญญาเอก Yann LeCun ในปี 1980
เวอร์ชันแรกของ CNN - LeNet ซึ่งตั้งชื่อตาม LeCun สามารถจดจำตัวเลขที่เขียนด้วยลายมือได้ จากนั้นนำไปใช้ในบริการธนาคารและไปรษณีย์เพื่ออ่านตัวเลขบนเช็คและรหัสไปรษณีย์ที่เขียนบนซองจดหมาย
อย่างไรก็ตาม เวอร์ชันแรกนี้ขาดการปรับขนาด ดังนั้นซีเอ็นเอ็นจึงไม่ได้ใช้ปัญญาประดิษฐ์และคอมพิวเตอร์วิทัศน์มากนัก นอกจากนี้ยังต้องการทรัพยากรและข้อมูลในการคำนวณที่สำคัญเพื่อให้ทำงานได้อย่างมีประสิทธิภาพมากขึ้นสำหรับรูปภาพขนาดใหญ่
นอกจากนี้ ในปี 2555 AlexNet ได้ทบทวนการเรียนรู้เชิงลึกอีกครั้งโดยใช้โครงข่ายประสาทเทียมที่ประกอบด้วยหลายชั้น ในช่วงเวลานี้ เทคโนโลยีได้รับการปรับปรุงให้ดีขึ้น และมีชุดข้อมูลขนาดใหญ่และทรัพยากรการประมวลผลจำนวนมาก เพื่อช่วยให้สามารถสร้าง CNN ที่ซับซ้อนซึ่งสามารถดำเนินกิจกรรมคอมพิวเตอร์วิทัศน์ได้อย่างมีประสิทธิภาพ
เลเยอร์ใน CNN
มาทำความเข้าใจเลเยอร์ต่าง ๆ ใน CNN กันเถอะ การเพิ่มเลเยอร์ใน CNN จะเพิ่มความซับซ้อนและทำให้สามารถตรวจจับลักษณะหรือพื้นที่ของรูปภาพได้มากขึ้น เริ่มต้นด้วยคุณสมบัติที่เรียบง่าย จะสามารถตรวจจับคุณสมบัติที่ซับซ้อน เช่น รูปร่างของวัตถุและองค์ประกอบที่ใหญ่ขึ้น จนกระทั่งสามารถตรวจจับภาพได้ในที่สุด
Convolutional Layer
เลเยอร์แรกของซีเอ็นเอ็นคือเลเยอร์ที่บิดเบี้ยว เป็นหน่วยการสร้างหลักของ CNN ที่การคำนวณส่วนใหญ่เกิดขึ้น ต้องการส่วนประกอบน้อยลง เช่น ข้อมูลเข้า แผนผังคุณลักษณะ และตัวกรอง

ซีเอ็นเอ็นสามารถมีเลเยอร์ที่โค้งงอเพิ่มเติมได้ สิ่งนี้ทำให้โครงสร้าง CNN มีลำดับชั้นเนื่องจากเลเยอร์ที่ตามมาสามารถเห็นภาพพิกเซลภายในฟิลด์ที่เปิดรับของเลเยอร์ก่อนหน้า ขั้นต่อไป เลเยอร์ที่บิดเบี้ยวจะเปลี่ยนรูปภาพที่กำหนดให้เป็นค่าตัวเลข และช่วยให้เครือข่ายเข้าใจและแยกรูปแบบที่มีค่า
การรวมเลเยอร์
การรวมเลเยอร์ใช้เพื่อลดขนาดและเรียกว่าการสุ่มตัวอย่าง จะช่วยลดพารามิเตอร์ที่ใช้ในการป้อนข้อมูล การดำเนินการรวมกลุ่มสามารถย้ายตัวกรองไปยังอินพุตทั้งหมดได้ เช่น เลเยอร์ที่เกิดการบิดเบี้ยว แต่ไม่มีน้ำหนัก ในที่นี้ ตัวกรองจะใช้ฟังก์ชันร่วมกับค่าตัวเลขในช่องรับเพื่อเติมอาร์เรย์ผลลัพธ์
การรวมกลุ่มมีสองประเภท:
- การรวมค่าเฉลี่ย: ค่าเฉลี่ยจะถูกคำนวณในฟิลด์ที่เปิดกว้างที่ filer กวาดผ่านอินพุตเพื่อส่งไปยังอาร์เรย์เอาต์พุต
- การรวมกลุ่มสูงสุด: เลือกพิกเซลค่าสูงสุดและส่งไปยังอาร์เรย์เอาต์พุตเมื่อตัวกรองกวาดเหนืออินพุต Max pooling ถูกใช้มากกว่าการ pool เฉลี่ย
แม้ว่าข้อมูลสำคัญจะหายไปในการรวมกลุ่ม แต่ก็ยังมีประโยชน์มากมายสำหรับ CNN ช่วยลดความเสี่ยงและความซับซ้อนที่มากเกินไปในขณะที่ปรับปรุงประสิทธิภาพ นอกจากนี้ยังช่วยเพิ่มเสถียรภาพของ CNN
เชื่อมต่ออย่างสมบูรณ์ (FC) Layer

ตามชื่อที่แนะนำ โหนดทั้งหมดในเลเยอร์เอาต์พุตจะเชื่อมต่อโดยตรงกับโหนดของเลเยอร์ก่อนหน้าในเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์ มันจัดประเภทรูปภาพตามคุณสมบัติที่แยกออกมาผ่านเลเยอร์ก่อนหน้าพร้อมกับตัวกรอง
นอกจากนี้ โดยทั่วไปเลเยอร์ FC จะใช้ฟังก์ชันการเปิดใช้งาน softmax เพื่อจัดประเภทอินพุตอย่างถูกต้องแทนฟังก์ชัน ReLu (เช่นในกรณีของการรวมเลเยอร์และเลเยอร์แบบ Convolutional) สิ่งนี้ช่วยสร้างความน่าจะเป็นเป็น 0 หรือ 1
CNN ทำงานอย่างไร?
โครงข่ายประสาทเทียมประกอบด้วยหลายชั้น แม้กระทั่งหลายร้อยชั้น เลเยอร์เหล่านี้เรียนรู้ที่จะระบุคุณลักษณะต่างๆ ของรูปภาพที่กำหนด
แม้ว่า CNN จะเป็นโครงข่ายประสาทเทียม แต่สถาปัตยกรรมของ CNN นั้นแตกต่างจาก ANN ปกติ

หลังใส่ข้อมูลผ่านเลเยอร์ที่ซ่อนอยู่จำนวนมากเพื่อแปลง โดยที่แต่ละชั้นถูกสร้างขึ้นด้วยชุดของเซลล์ประสาทเทียมและเชื่อมต่ออย่างสมบูรณ์กับเซลล์ประสาททุกอันในเลเยอร์เดียวกัน ในที่สุดก็มีเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์หรือเลเยอร์เอาต์พุตเพื่อแสดงผลลัพธ์
ในทางกลับกัน CNN จัดระเบียบเลเยอร์ในสามมิติ – กว้าง ลึก และสูง ในที่นี้ เลเยอร์จากเซลล์ประสาทจะเชื่อมต่อกับเซลล์ประสาทในพื้นที่เล็กๆ เท่านั้น แทนที่จะเชื่อมโยงกับแต่ละเซลล์ในเลเยอร์ถัดไป ในที่สุด ผลลัพธ์สุดท้ายจะแสดงด้วยเวกเตอร์เดียวที่มีคะแนนความน่าจะเป็นและมีเพียงมิติความลึกเท่านั้น
ตอนนี้ คุณอาจถามว่า "การบิดเบี้ยว" คืออะไรใน CNN
การบิดหมายถึงการดำเนินการทางคณิตศาสตร์เพื่อรวมชุดข้อมูลสองชุด ใน CNN แนวคิด Convolution ถูกนำไปใช้กับข้อมูลอินพุตเพื่อส่งออกแผนที่คุณลักษณะโดยการกรองข้อมูล
สิ่งนี้นำเราไปสู่แนวคิดและคำศัพท์ที่สำคัญบางประการที่ใช้ในซีเอ็นเอ็น
- ตัวกรอง : หรือที่เรียกว่าตัวตรวจจับคุณลักษณะหรือเคอร์เนล ตัวกรองสามารถมีมิติบางอย่างได้ เช่น 3×3 มันข้ามอิมเมจอินพุตเพื่อทำการคูณเมทริกซ์สำหรับแต่ละองค์ประกอบเพื่อใช้การบิด การใช้ฟิลเตอร์กับรูปภาพการฝึกทุกภาพที่ความละเอียดต่างกัน บวกกับเอาต์พุตของรูปภาพที่รวมเข้าด้วยกันจะทำงานเป็นอินพุตสำหรับเลเยอร์ถัดไป
- Padding : ใช้เพื่อขยายอินพุตเมทริกซ์ไปยังเส้นขอบของเมทริกซ์โดยการแทรกพิกเซลปลอม มันทำเพื่อโต้กลับความจริงที่ว่าการบิดลดขนาดเมทริกซ์ ตัวอย่างเช่น เมทริกซ์ขนาด 9×9 สามารถเปลี่ยนเป็นเมทริกซ์ขนาด 3×3 ได้หลังจากการกรอง
- Striding : หากคุณต้องการได้ผลลัพธ์ที่น้อยกว่าอินพุตของคุณ คุณสามารถดำเนินการ striding ได้ อนุญาตให้ข้ามบางพื้นที่ในขณะที่ตัวกรองเลื่อนเหนือรูปภาพ ด้วยการข้ามสองหรือสามพิกเซล คุณสามารถสร้างเครือข่ายที่มีประสิทธิภาพมากขึ้นโดยการลดความละเอียดเชิงพื้นที่
- น้ำหนักและอคติ: CNN มีน้ำหนักและอคติในเซลล์ประสาท แบบจำลองสามารถเรียนรู้ค่าเหล่านั้นได้ในขณะฝึก และค่าจะยังคงเหมือนเดิมตลอดทั้งเลเยอร์ที่กำหนดสำหรับเซลล์ประสาททั้งหมด นี่หมายความว่าเซลล์ประสาทที่ซ่อนอยู่แต่ละเซลล์จะตรวจจับลักษณะเดียวกันในพื้นที่ต่างๆ ของภาพ เป็นผลให้เครือข่ายมีความอดทนมากขึ้นในขณะที่แปลวัตถุเป็นภาพที่กำหนด
- ReLU : ย่อมาจาก Rectified Linear Unit (ReLu) และใช้สำหรับการฝึกอบรมที่มีประสิทธิภาพและรวดเร็วยิ่งขึ้น มันจับคู่ค่าลบเป็น 0 และรักษาค่าบวก เรียกอีกอย่างว่าการเปิดใช้งาน เนื่องจากเครือข่ายดำเนินการเฉพาะคุณลักษณะภาพที่เปิดใช้งานในเลเยอร์ถัดไป
- ฟิลด์แบบรับ: ในโครงข่ายประสาทเทียม เซลล์ประสาททุกเซลล์รับอินพุตจากตำแหน่งที่แตกต่างจากเลเยอร์ก่อนหน้า และในชั้นที่บิดเบี้ยว เซลล์ประสาททุกเซลล์รับข้อมูลจากพื้นที่จำกัดของชั้นก่อนหน้าเท่านั้น เรียกว่าสนามรับของเซลล์ประสาท ในกรณีของเลเยอร์ FC เลเยอร์ก่อนหน้าทั้งหมดเป็นฟิลด์ที่เปิดกว้าง
ในงานคำนวณในโลกแห่งความเป็นจริง โดยปกติแล้ว จะใช้การบิดเป็นภาพ 3 มิติที่ต้องใช้ฟิลเตอร์ 3 มิติ
กลับมาที่ CNN ประกอบด้วยส่วนต่างๆ หรือชั้นโหนดต่างๆ แต่ละชั้นของโหนดมีเกณฑ์และน้ำหนักและเชื่อมต่อกับชั้นอื่น เมื่อเกินขีดจำกัด ข้อมูลจะถูกส่งไปยังเลเยอร์ถัดไปในเครือข่ายนี้
เลเยอร์เหล่านี้สามารถดำเนินการเปลี่ยนแปลงข้อมูลเพื่อเรียนรู้คุณลักษณะที่เกี่ยวข้องได้ นอกจากนี้ การดำเนินการเหล่านี้ยังทำซ้ำเลเยอร์ต่างๆ อีกหลายร้อยเลเยอร์เพื่อเรียนรู้ที่จะตรวจหาคุณสมบัติอื่นๆ ของรูปภาพต่อไป

ส่วนของซีเอ็นเอ็นคือ:
- เลเยอร์อินพุต: นี่คือที่ที่รับอินพุต เช่น รูปภาพ มันจะเป็นวัตถุ 3 มิติที่มีความสูง ความกว้าง และความลึกที่กำหนดไว้
- เลเยอร์ที่ซ่อนอยู่หนึ่งชั้น/หลายชั้นหรือขั้นตอนการแยกคุณลักษณะ: เลเยอร์เหล่านี้อาจเป็นเลเยอร์แบบ Convolutional เลเยอร์การรวม และเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์
- เลเยอร์ผลลัพธ์: ที่นี่ ผลลัพธ์จะแสดงขึ้น
การส่งผ่านรูปภาพผ่านเลเยอร์การบิดจะเปลี่ยนเป็นแผนผังคุณลักษณะหรือแผนที่เปิดใช้งาน หลังจากแปลงอินพุตแล้ว เลเยอร์จะหมุนรูปภาพและส่งผ่านผลลัพธ์ไปยังเลเยอร์ถัดไป
CNN จะดำเนินการ convolutions และเทคนิคการรวมจำนวนมากเพื่อตรวจหาคุณลักษณะในระหว่างขั้นตอนการแยกคุณลักษณะ ตัวอย่างเช่น หากคุณป้อนรูปแมว ซีเอ็นเอ็นจะจดจำทั้งสี่ขา สี ตาสองข้าง ฯลฯ
ถัดไป เลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์ใน CNN จะทำหน้าที่เป็นตัวแยกประเภทเหนือคุณสมบัติที่แยกออกมา ขึ้นอยู่กับสิ่งที่อัลกอริธึมการเรียนรู้เชิงลึกคาดการณ์เกี่ยวกับภาพ เลเยอร์จะให้ผลลัพธ์
ข้อดีของ CNNs

ความแม่นยำสูงขึ้น
CNN มีความแม่นยำสูงกว่าโครงข่ายประสาทเทียมทั่วไปที่ไม่ใช้การบิด CNN มีประโยชน์ โดยเฉพาะอย่างยิ่งเมื่องานเกี่ยวข้องกับข้อมูลจำนวนมาก การจดจำวิดีโอและรูปภาพ ฯลฯ ให้ผลลัพธ์และการคาดคะเนที่แม่นยำสูง จึงมีการใช้งานเพิ่มขึ้นในภาคส่วนต่างๆ
ประสิทธิภาพการคำนวณ

CNN เสนอระดับประสิทธิภาพในการคำนวณที่สูงกว่าโครงข่ายประสาทเทียมทั่วไป นี่เป็นเพราะการใช้กระบวนการบิด พวกเขายังใช้การลดขนาดและการแบ่งปันพารามิเตอร์เพื่อทำให้โมเดลใช้งานได้เร็วและง่ายขึ้น เทคนิคเหล่านี้สามารถปรับให้เหมาะกับการทำงานบนอุปกรณ์ต่าง ๆ ไม่ว่าจะเป็นสมาร์ทโฟนหรือแล็ปท็อปของคุณ

การแยกคุณลักษณะ
CNN สามารถเรียนรู้คุณลักษณะของรูปภาพได้อย่างง่ายดายโดยไม่ต้องมีการจัดการด้วยตนเอง คุณสามารถใช้ประโยชน์จาก CNN ที่ได้รับการฝึกอบรมล่วงหน้าและจัดการน้ำหนักโดยป้อนข้อมูลให้กับพวกเขาเมื่อทำงานใหม่ และ CNN จะปรับให้เข้ากับมันอย่างราบรื่น
แอปพลิเคชันของ CNN
CNN ถูกใช้ในอุตสาหกรรมต่างๆ สำหรับกรณีการใช้งานต่างๆ แอปพลิเคชั่นในชีวิตจริงของ CNN ได้แก่:
การจำแนกรูปภาพ

CNN ใช้กันอย่างแพร่หลายในการจัดหมวดหมู่รูปภาพ สิ่งเหล่านี้สามารถจดจำคุณสมบัติที่มีค่าและระบุวัตถุในภาพที่กำหนด ดังนั้นจึงใช้ในภาคส่วนต่างๆ เช่น การดูแลสุขภาพ โดยเฉพาะ MRI นอกจากนี้ เทคโนโลยีนี้ยังใช้ในการจดจำตัวเลขที่เขียนด้วยลายมือ ซึ่งเป็นหนึ่งในกรณีการใช้งาน CNN ที่เก่าแก่ที่สุดในการมองเห็นด้วยคอมพิวเตอร์
การตรวจจับวัตถุ
CNN สามารถตรวจจับวัตถุในภาพได้แบบเรียลไทม์ และยังติดป้ายกำกับและจำแนกวัตถุเหล่านั้น ดังนั้นเทคนิคนี้จึงใช้กันอย่างแพร่หลายในรถยนต์อัตโนมัติ นอกจากนี้ยังช่วยให้บ้านอัจฉริยะและคนเดินเท้าสามารถจดจำใบหน้าของเจ้าของรถได้ นอกจากนี้ยังใช้ในระบบเฝ้าระวังที่ขับเคลื่อนด้วย AI เพื่อตรวจจับและทำเครื่องหมายวัตถุ

การจับคู่ภาพและเสียง
ความช่วยเหลือของ CNN ในการจับคู่ภาพและเสียงช่วยปรับปรุงแพลตฟอร์มการสตรีมวิดีโอเช่น Netflix, YouTube เป็นต้น นอกจากนี้ยังช่วยตอบสนองคำขอของผู้ใช้เช่น "เพลงรักของ Elton John"
การรู้จำเสียง

นอกจากรูปภาพแล้ว CNN ยังมีประโยชน์ในการประมวลผลภาษาธรรมชาติ (NLP) และการรู้จำคำพูด ตัวอย่างในโลกแห่งความเป็นจริงคือ Google ที่ใช้ CNN ในระบบรู้จำเสียงพูด
การสร้างวัตถุขึ้นใหม่
สามารถใช้ CNN ในการสร้างแบบจำลอง 3 มิติของวัตถุจริงในสภาพแวดล้อมดิจิทัล นอกจากนี้ยังเป็นไปได้สำหรับโมเดล CNN เพื่อสร้างโมเดลใบหน้า 3 มิติโดยใช้รูปภาพ นอกจากนี้ CNN ยังมีประโยชน์ในการสร้างฝาแฝดดิจิทัลในด้านเทคโนโลยีชีวภาพ การผลิต เทคโนโลยีชีวภาพ และสถาปัตยกรรม
การใช้งานของ CNN ในภาคต่างๆ ได้แก่:
- การ ดูแลสุขภาพ: คอมพิวเตอร์วิทัศน์สามารถใช้ในรังสีวิทยาเพื่อช่วยให้แพทย์ตรวจหาเนื้องอกมะเร็งได้อย่างมีประสิทธิภาพมากขึ้นในคน
- เกษตรกรรม: เครือข่ายสามารถใช้ภาพจากดาวเทียมเทียม เช่น LSAT และใช้ประโยชน์จากข้อมูลนี้เพื่อจำแนกดินแดนที่อุดมสมบูรณ์ นอกจากนี้ยังช่วยคาดการณ์ระดับความอุดมสมบูรณ์ของที่ดินและพัฒนากลยุทธ์ที่มีประสิทธิภาพเพื่อเพิ่มผลผลิตให้สูงสุด
- การ ตลาด: แอปพลิเคชั่นโซเชียลมีเดียสามารถแนะนำบุคคลในรูปภาพที่โพสต์บนโปรไฟล์ของใครบางคน ซึ่งจะช่วยให้คุณแท็กผู้คนในอัลบั้มรูปภาพของคุณได้
- การ ขายปลีก: แพลตฟอร์มอีคอมเมิร์ซสามารถใช้การค้นหาด้วยภาพเพื่อช่วยให้แบรนด์แนะนำสินค้าที่เกี่ยวข้องซึ่งลูกค้าเป้าหมายต้องการซื้อ
- ยานยนต์: CNN พบการใช้งานในรถยนต์เพื่อปรับปรุงความปลอดภัยของผู้โดยสารและคนขับ ด้วยความช่วยเหลือของคุณสมบัติต่างๆ เช่น การตรวจจับเส้นเลน การตรวจจับวัตถุ การจัดประเภทภาพ ฯลฯ นอกจากนี้ยังช่วยให้โลกของรถยนต์ที่ขับด้วยตนเองมีวิวัฒนาการมากขึ้น
แหล่งข้อมูลเพื่อเรียนรู้ CNNs
คอร์สรา:
Coursera มีหลักสูตรนี้เกี่ยวกับ CNN ที่คุณสามารถพิจารณาได้ หลักสูตรนี้จะสอนคุณว่าคอมพิวเตอร์วิทัศน์มีวิวัฒนาการอย่างไรในช่วงหลายปีที่ผ่านมาและการประยุกต์ใช้ CNN ในโลกสมัยใหม่
อเมซอน:
คุณสามารถอ่านหนังสือและการบรรยายเหล่านี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ CNN:
- โครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก: ครอบคลุมแบบจำลอง อัลกอริทึม และทฤษฎีของการเรียนรู้เชิงลึกและโครงข่ายประสาทเทียม
ดูตัวอย่าง | ผลิตภัณฑ์ | เรตติ้ง | ราคา | |
---|---|---|---|---|
![]() | โครงข่ายประสาทเทียมและการเรียนรู้ลึก: ตำราเรียน | $49.00 | ซื้อใน Amazon |
- A Guide to Convolutional Neural Networks for Computer Vision: หนังสือเล่มนี้จะสอนคุณเกี่ยวกับการประยุกต์ใช้ CNN และแนวคิดของพวกเขา
ดูตัวอย่าง | ผลิตภัณฑ์ | เรตติ้ง | ราคา | |
---|---|---|---|---|
![]() | คู่มือ Convolutional Neural Networks สำหรับ Computer Vision (บรรยายการสังเคราะห์ทางคอมพิวเตอร์วิทัศน์) | $49.26 | ซื้อใน Amazon |
- Hands-on Convolutional Neural Networks with Tensorflow: คุณสามารถแก้ปัญหาต่างๆ ในการมองเห็นด้วยคอมพิวเตอร์โดยใช้ Python และ TensorFlow ด้วยความช่วยเหลือของหนังสือเล่มนี้
ดูตัวอย่าง | ผลิตภัณฑ์ | เรตติ้ง | ราคา | |
---|---|---|---|---|
![]() | Hands-On Convolutional Neural Networks กับ TensorFlow: แก้ปัญหาการมองเห็นด้วยคอมพิวเตอร์ด้วยการสร้างแบบจำลอง... | $15.24 | ซื้อใน Amazon |
- การเรียนรู้เชิงลึกประยุกต์ขั้นสูง: หนังสือเล่มนี้จะช่วยให้คุณเข้าใจซีเอ็นเอ็น การเรียนรู้เชิงลึก และแอปพลิเคชันขั้นสูง รวมถึงการตรวจหาวัตถุ
ดูตัวอย่าง | ผลิตภัณฑ์ | เรตติ้ง | ราคา | |
---|---|---|---|---|
![]() | การเรียนรู้เชิงลึกประยุกต์ขั้นสูง: Convolutional Neural Networks และการตรวจจับวัตถุ | $23.74 | ซื้อใน Amazon |
- Convolutional Neural Networks และ Recurrent Neural Networks: หนังสือเล่มนี้จะสอนคุณเกี่ยวกับ CNN และ RNN และวิธีสร้างเครือข่ายเหล่านี้
ดูตัวอย่าง | ผลิตภัณฑ์ | เรตติ้ง | ราคา | |
---|---|---|---|---|
![]() | Convolutional Neural Networks และ Recurrent Neural Networks: Convolutional Neural Networks และ... | $1.99 | ซื้อใน Amazon |
บทสรุป
Convolutional Neural Network เป็นหนึ่งในสาขาที่เกิดขึ้นใหม่ของปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และการเรียนรู้เชิงลึก มีการใช้งานที่หลากหลายในโลกปัจจุบันในเกือบทุกภาคส่วน เมื่อพิจารณาจากการใช้งานที่เพิ่มขึ้นแล้ว คาดว่าจะขยายได้มากขึ้นและมีประโยชน์มากขึ้นในการแก้ปัญหาในโลกแห่งความเป็นจริง