Nvidia Maxine: การแปลวิดีโอคอลแบบเรียลไทม์ที่ขับเคลื่อนด้วย AI
เผยแพร่แล้ว: 2021-04-27Nvidia Corporation ยักษ์ใหญ่ด้านการประมวลผลกราฟิกในแคลิฟอร์เนียเพิ่งเปิดตัวคุณสมบัติใหม่ที่เรียกว่า Nvidia Maxine Nvidia Maxine เป็นนวัตกรรมล้ำสมัยที่ผสมผสานปัญญาประดิษฐ์เข้ากับเทคโนโลยีการสนทนาทางวิดีโอเพื่อสร้างซอฟต์แวร์ที่ช่วยในการทำงานต่างๆ ที่ช่วยปรับปรุงคุณภาพและความเร็วของวิดีโอ สามารถใช้เป็นเครื่องมือสำหรับซอฟต์แวร์วิดีโอคอลอื่นๆ เพื่อลดความไม่แม่นยำ
โดยมีฟีเจอร์มากมาย เช่น การเพิ่มประสิทธิภาพกราฟิกอัตโนมัติ การจัดตำแหน่งใบหน้าอัตโนมัติ และการแปลภาษาอัตโนมัติ — บริการทั้งหมดที่สามารถทำให้แฮงเอาท์วิดีโอเป็นกิจกรรมที่ปราศจากข้อผิดพลาด สิ่งสำคัญที่สุดคือ คุณลักษณะการปรับปรุงกราฟิกอาจมีผลกระทบกว้างไกลสำหรับพื้นที่ที่ยังไม่พัฒนาซึ่งทำงานด้วยแบนด์วิธต่ำ
- Nvidia Maxine คืออะไร?
- คุณลักษณะการแปลวิดีโอคอลตามเวลาจริงของ Nvidia คืออะไร
- Nvidia Maxine ทำงานอย่างไร
- มันคุ้มค่ากับการโฆษณาหรือไม่?
- คำสุดท้าย
Nvidia Maxine คืออะไร?

Nvidia Maxine เป็นชุดเครื่องมือเพิ่มประสิทธิภาพวิดีโอที่พัฒนาโดย Nvidia Corporation และเปิดตัวในเดือนตุลาคม 2020 ที่งาน GPU Technology Conference (การประชุมระดับโลกที่จัดโดย Nvidia เพื่อส่งเสริมการอภิปรายเกี่ยวกับการพัฒนาปัญญาประดิษฐ์กับวิศวกร นักพัฒนา และนักประดิษฐ์ที่ดีที่สุดในโลก การเข้าร่วม). เป็นการปฏิวัติเพิ่มเติมในโลกของการส่งสัญญาณวิดีโอที่แก้ไขความไม่ถูกต้องหรือข้อบกพร่องที่อาจเกิดขึ้นในการโทรศัพท์จนถึงระดับที่สามารถปรับปรุงวิธีที่เราดำเนินการแฮงเอาท์วิดีโอได้อย่างสมบูรณ์
คุณสมบัติบางอย่างของ Nvidia Maxine ที่ดึงดูดความสนใจอย่างรวดเร็วในชุมชน AI คือคุณสมบัติที่สามารถสร้างและแยกแยะใบหน้า พื้นหลัง เสียง และแม้กระทั่งลักษณะใบหน้าได้โดยอัตโนมัติ
สำหรับตอนนี้ เครื่องมือเพิ่มประสิทธิภาพการสนทนาทางวิดีโอเหล่านี้พร้อมจำหน่ายให้กับบริษัทซอฟต์แวร์ที่อาจต้องการรวมเทคโนโลยีไว้ในโปรแกรมของตน แต่ความสำเร็จอาจหมายถึงคุณลักษณะดังกล่าวอาจพร้อมใช้งานอย่างกว้างขวางในเร็วๆ นี้
แนะนำสำหรับคุณ: ศิลปะแห่งการประชุมทางโทรศัพท์: วิธีเรียกใช้การประชุมออนไลน์ที่มีประสิทธิภาพ
คุณลักษณะการแปลวิดีโอคอลตามเวลาจริงของ Nvidia คืออะไร

Nvidia Maxine มาพร้อมกับหน่วยแปลภาษาที่สามารถแปลการสนทนาทางวิดีโอจากและเป็นภาษาใดก็ได้ในเวลาไม่กี่วินาที สิ่งประดิษฐ์นี้สามารถพิสูจน์ได้ว่าเป็นประโยชน์อย่างมากสำหรับประเทศที่ทำธุรกิจกับชาวต่างชาติ
สิ่งนี้สามารถพิสูจน์ได้ว่าเป็นประโยชน์อย่างยิ่งในความสัมพันธ์กับประเทศต่างๆ เช่น จีนและยุโรปส่วนใหญ่ ซึ่งเป็นประเทศที่มีความสัมพันธ์ทางการค้าที่ดีกับประเทศส่วนใหญ่แต่ไม่ได้พูดภาษาอังกฤษเป็นภาษาราชการ สิ่งนี้จะช่วยกระชับความสัมพันธ์ทางธุรกิจและนำการเปลี่ยนแปลงทางเศรษฐกิจและการเงินครั้งใหญ่มาสู่ประเทศที่จ้างงาน
อีกสิ่งหนึ่งที่ทำให้ฟีเจอร์นี้แตกต่างจากฟีเจอร์อื่นๆ เช่น Google แปลภาษาคือความสามารถในการแปลบทสนทนาและบทสนทนาแบบเรียลไทม์ ซึ่งหมายความว่าจะไม่มีการหยุดชั่วคราวที่น่าอึดอัดใจในการสนทนาทางวิดีโอต่างประเทศ เมื่อนักแปลที่เป็นมนุษย์เริ่มเข้าสู่การแปลแบบวงเวียน หรือเมื่อมีคนคลำหา Google แปลภาษาเพื่อทำความเข้าใจสิ่งที่กำลังพูด
การทำงานกับบริษัทต่างชาติที่ไม่มีภาษากลางนั้นเป็นงานที่ยากเสมอ แต่ด้วยการระบาดของ COVID-19 ที่จุดสูงสุดของระลอกที่สอง งานดังกล่าวจึงยากขึ้นมากเมื่อจัดการประชุมในรูปแบบทางไกลด้วยความช่วยเหลือของแอพต่างๆ เช่น ซูมและ Skype เฟรมค้างและการส่งสัญญาณเสียงที่ผิดพลาดเนื่องจากการเชื่อมต่ออินเทอร์เน็ตที่ช้าเป็นเรื่องปกติที่เกิดขึ้น แต่สิ่งที่ทำให้การประชุมในภาษาต่างประเทศเป็นเรื่องที่ยากเย็นแสนเข็ญ Nvidia Maxine กำลังได้รับการขนานนามว่าเป็นสิ่งที่จะช่วยให้ผู้ใช้กำจัดความไม่สะดวกที่น่ารำคาญเหล่านี้ด้วยคุณสมบัติการแปลวิดีโอคอลแบบเรียลไทม์ ซึ่งทำให้มันเป็นสิ่งประดิษฐ์ที่ไม่สามารถเกิดขึ้นได้ในเวลาที่ดีกว่านี้

Nvidia Maxine ทำงานอย่างไร

องค์ประกอบสำคัญในความเร็วที่ Nvidia Maxine แปลภาษาอย่างเป็นธรรมชาติคือการใช้ปัญญาประดิษฐ์ (AI) เพื่อแยกแยะรูปแบบการพูดและเสียงเพื่อแปลประโยคเป็นภาษาที่เลือกโดยใช้เวลาน้อยที่สุด
Maxine ของ Nvidia ใช้สิ่งที่เรียกว่า 'การเรียนรู้เชิงลึก' เพื่อให้ได้เอฟเฟกต์ส่วนใหญ่จากเครื่องมือ การเรียนรู้เชิงลึกคือการเรียนรู้ด้วย AI ประเภทหนึ่งที่ได้รับความนิยมซึ่งเรียกว่าการเรียนรู้ของเครื่อง ซึ่งพัฒนาขึ้นครั้งแรกในปี 2012 และเป็นเทคโนโลยีที่อยู่เบื้องหลังแอปจดจำใบหน้า ฟีเจอร์การแปล และระบบแนะนำเนื้อหาส่วนใหญ่
เครื่องมือที่รวมอยู่ในกลุ่มผลิตภัณฑ์ของ Nvidia Maxine จนถึงขณะนี้ ได้แก่ การแปลงวิดีโอความละเอียดต่ำเป็นวิดีโอความละเอียดสูงโดยใช้ AI การจัดตำแหน่งใบหน้าอัตโนมัติ การลดสัญญาณรบกวน และแน่นอน คุณลักษณะการแปลที่ทำงานแบบเรียลไทม์ เครื่องมือเหล่านี้จะเป็นประโยชน์สำหรับผู้ที่มีการเชื่อมต่ออินเทอร์เน็ตที่ไม่เสถียร สถานที่ทำงานที่มีเสียงดัง และอุปสรรคด้านภาษาในขณะดำเนินการประชุมทางไกล
นอกเหนือจากคุณสมบัติการแปลตามเวลาจริง เครื่องมือที่น่าสนใจที่สุดของ Nvidia Maxine คือคำมั่นสัญญาว่าจะลดแบนด์วิดท์ที่จำเป็นสำหรับการส่งวิดีโอภาพความละเอียดสูงที่ราบรื่น พูดง่ายๆ ก็คือ สิ่งประดิษฐ์ใหม่ล่าสุดของ GPU ยักษ์นี้ทำงานบนเหตุผลว่าไม่จำเป็นต้องส่งข้อมูลภาพทั้งหมดในวิดีโอใด ๆ เพื่อให้ได้ภาพที่มีความละเอียดสูงในอีกด้านหนึ่ง Maxine ทำงานโดยส่งเฉพาะบางจุดของภาพ จากนั้นเติมช่องว่างด้วยความช่วยเหลือของเทคโนโลยีปัญญาประดิษฐ์ (AI)
มันคุ้มค่ากับการโฆษณาหรือไม่?

สิ่งประดิษฐ์ของ Nvidia ก่อให้เกิดคำถามบางประการเกี่ยวกับจริยธรรมของการจัดการแฮงเอาท์วิดีโอปลอม โดยอ้างถึงการเพิ่มขึ้นของผู้แอบอ้างที่หลอกผู้คนให้คิดว่าพวกเขาเป็นครอบครัวหรือเพื่อน นอกจากนี้ การอภิปรายจะยังคงเปิดอยู่สำหรับการแปลโดยมนุษย์เทียบกับการแปลด้วยเครื่อง อย่างน้อยก็อีกหลายวัน
อย่างไรก็ตาม การระบาดใหญ่ของโควิด-19 ได้จำกัดประชากรส่วนใหญ่ของโลกให้ทำงานจากที่บ้าน เหตุการณ์นี้ทำให้อัตราการดาวน์โหลดซอฟต์แวร์และแอปพลิเคชันวิดีโอคอลเพิ่มขึ้นอย่างรวดเร็วในช่วงหลายเดือนที่ผ่านมา แสดงให้เห็นว่าคุณลักษณะของการสนทนาทางวิดีโอมีความสำคัญเพียงใดและโดยส่วนขยาย Nvidia Maxine มีความสำคัญต่ออนาคตของการประชุมทางไกลและการทำงานในสำนักงานเสมือน
นอกเหนือจากนั้น สถานะของ Nvidia ในฐานะบริษัทที่ให้บริการเทคโนโลยีล้ำสมัยแก่ผู้ใช้คอมพิวเตอร์ทุกประเภทตั้งแต่เกมเมอร์ไปจนถึงนักพัฒนาซอฟต์แวร์ทำให้การลงทุนครั้งนี้มีความน่าเชื่อถือ เนื่องจากความสามารถทางการเงินของบริษัท Nvidia ในการวิจัยและผลิตเครื่องมือเหล่านี้จำนวนมากสำหรับ ประโยชน์ของผู้ใช้
อย่างไรก็ตาม บางสิ่งที่อาจสร้างความตกตะลึงให้กับผู้ใช้บางรายอาจเป็นความต้องการของ Maxine ที่ต้องมี Nvidia GPU เพื่อให้ทำงานได้ ตัวแทนของ Nvidia ยังไม่ยืนยันเรื่องนี้
คุณอาจชอบ: ซอฟต์แวร์ตัดต่อวิดีโอ 10 ซอฟต์แวร์สำหรับใช้งานตั้งแต่เริ่มต้นจนถึงมืออาชีพ
คำสุดท้าย

ตอนนี้ยังคงต้องรอดูว่ายักษ์ใหญ่ด้านวิดีโอคอลรายอื่นๆ เช่น Zoom และ Microsoft ซื้อเทคโนโลยีของ Nvidia Maxine หรือพัฒนาบางอย่างของตนเองเพื่อเสริมแอปพลิเคชันวิดีโอคอลของตนหรือไม่ ด้วยการปรับปรุงด้านเทคโนโลยีในทุกช่วงตึก มันเป็นเรื่องท้าทายที่จะตามให้ทัน บริษัทแปลภาษาสามารถช่วยปรับซอฟต์แวร์ของคุณให้ตรงตามความต้องการของลูกค้าได้ พวกเขายังช่วยให้คุณแปลซอฟต์แวร์เป็นภาษาต่างๆ ได้มากกว่า 100 ภาษา