Data Fabric: มันคืออะไร เคล็ดลับ และแนวทางปฏิบัติที่ดีที่สุด
เผยแพร่แล้ว: 2022-11-05Gartner ตั้งชื่อ data fabric เพื่อช่วยองค์กรในการตรวจสอบและจัดการข้อมูลและแอปพลิเคชันของตน การรวบรวมข้อมูลและกลายเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูลมีความท้าทายมากกว่าที่เคย เนื่องจากธุรกิจต่างๆ ใช้แอพที่หลากหลาย และข้อมูลจะมีไดนามิกมากขึ้น
บริษัทต่างๆ ต้องการกลยุทธ์ที่ครอบคลุมจากการพัฒนาเทคโนโลยีข้อมูลและการวิเคราะห์ 10 อันดับแรกเพื่อแก้ไขปัญหาดังกล่าว ข้อมูลจากแหล่งที่มาและชนิดต่างๆ ถูกรวมเข้าด้วยกันเพื่อสร้างแหล่งเสมือนที่เป็นหนึ่งเดียว การเข้าถึงที่ราบรื่นและการแลกเปลี่ยนข้อมูลข้ามโครงสร้างพื้นฐานแบบกระจายนี้เป็นไปได้โดยสถาปัตยกรรมแบบบูรณาการนี้ โดยไม่คำนึงถึงแอปพลิเคชัน แพลตฟอร์ม หรือตำแหน่งที่เก็บข้อมูล
ในบล็อกนี้ เราจะพูดถึงว่า data fabric คืออะไร ความสำคัญ เคล็ดลับ และแนวปฏิบัติที่ดีที่สุด
ดัชนีเนื้อหา:
- ผ้าข้อมูลคืออะไร?
- ความสำคัญของโครงสร้างข้อมูล
- เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุด
- บทสรุป
ผ้าข้อมูลคืออะไร?
โครงสร้างข้อมูลเป็นสถาปัตยกรรมแบบบูรณาการที่ใช้ข้อมูลเพื่อนำเสนอจุดสิ้นสุดในสภาพแวดล้อมมัลติคลาวด์แบบไฮบริดที่มีความสามารถที่สอดคล้องกัน สถาปัตยกรรมแบบบูรณาการนี้ช่วยเพิ่มการมองเห็น การเข้าถึง และการควบคุมโดยการสร้างวิธีการที่สอดคล้องกันสำหรับการจัดการข้อมูล สิ่งสำคัญที่สุดคือ มันสร้างความสอดคล้องกันทั่วทั้งสภาพแวดล้อมของคุณ ทำให้สามารถใช้และแชร์ข้อมูลได้ทุกที่
สถาปัตยกรรมแบบบูรณาการนี้เป็นเครื่องมือหลักสำหรับบริษัทหลายแห่งในการแปลงข้อมูลดิบให้เป็นข่าวกรองธุรกิจที่นำไปดำเนินการได้ ทำให้เข้าถึงการวิเคราะห์ได้มากขึ้น โดยเฉพาะอย่างยิ่งสำหรับการใช้ AI และการเรียนรู้ของเครื่อง เนื่องจากสามารถลดความพยายามในการจัดการข้อมูลได้มากถึง 70% Gartner จึงเลือกให้เป็นเทรนด์เทคโนโลยีเชิงกลยุทธ์อันดับต้น ๆ สำหรับปี 2022
บริษัทมักจะคัดลอกข้อมูลเพื่อรวมไว้ในที่เดียว ซึ่งมีค่าใช้จ่ายสูงและอาจทำให้เกิดปัญหาด้านการปฏิบัติตามข้อกำหนดและความปลอดภัยของข้อมูลตลอดวงจรชีวิตของข้อมูล แต่ก็ยังมีเหตุผลที่ดีที่จะรวมข้อมูลนั้นเข้าด้วยกัน ธุรกิจจำนวนมากอาจเลือกใช้ data fabric เป็นโซลูชันทางสถาปัตยกรรมเพื่อให้:
- เข้าถึงข้อมูลที่มีอยู่
- ควบคุมวงจรชีวิตของข้อมูล
- ทำให้กระบวนการย้ายข้อมูลเป็นไปโดยอัตโนมัติ
ความสำคัญของดาต้าแฟบริค
องค์กรไม่สามารถใช้ประโยชน์และเพิ่มมูลค่าของข้อมูลได้ทั้งหมด เนื่องจากปัญหาต่างๆ รวมถึงการเข้าถึงข้อมูลอย่างจำกัด (เช่น ข้อมูลไม่สามารถเข้าถึงได้โดยผู้ที่ต้องการข้อมูล) และความซับซ้อนของการรวมข้อมูล
การรวมข้อมูลแบบดั้งเดิมไม่เพียงพอสำหรับความต้องการทางธุรกิจอีกต่อไป เช่น การแปลงเป็นสากล การเชื่อมต่อแบบเรียลไทม์ ฯลฯ บริษัทจำนวนมากต้องการความช่วยเหลือในการรวม ผสานรวม และแปลงข้อมูลองค์กรจากแหล่งต่างๆ
Data Fabric ให้ผู้ใช้เข้าถึงข้อมูลที่หลากหลายได้ทันที และช่วยให้แสดงภาพได้ไม่ว่าผู้ใช้จะอยู่ที่ใด การกำกับดูแลและการจัดการข้อมูลในภูมิทัศน์ข้อมูลแบบมัลติคลาวด์สามารถทำให้ผู้ใช้ง่ายขึ้นโดยใช้ data fabric
เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุด
ข้อมูลเมตาของธุรกิจ การปฏิบัติงาน และทางเทคนิคควรได้รับการจัดการอย่างจริงจังหากโครงสร้างข้อมูลได้รับการจัดการอย่างดี พนักงานบริษัททุกคนต้องมีแคตตาล็อกข้อมูลและคำศัพท์ทางธุรกิจเพื่อให้สิ่งนี้เกิดขึ้น
ทุกคนในองค์กรสามารถแบ่งปันความรู้เกี่ยวกับข้อมูลในขณะที่ใช้งาน ต้องเก็บกำหนดการไว้สำหรับแหล่งที่มาทั้งหมดเพื่อให้มีการนำเข้าข้อมูลเมตาในอัตราที่อนุญาตให้มีการเลื่อนข้อมูลในปริมาณที่เหมาะสม
เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุดมีดังนี้
ใช้โมเดลกระบวนการ DataOps
แม้ว่าแนวคิดของ dataOps และ data fabric จะแตกต่างกัน แต่ dataOps สามารถเป็นตัวเปิดใช้งานที่สำคัญได้ กระบวนการข้อมูล เครื่องมือ และผู้คนที่ใช้ข้อมูลเชิงลึกล้วนเชื่อมต่อกันอย่างใกล้ชิด ตามแบบจำลองของกระบวนการ DataOps
ผู้ใช้อยู่ในตำแหน่งที่ต้องพึ่งพาข้อมูลอย่างต่อเนื่อง ใช้เครื่องมือที่มีอยู่อย่างมีความหมาย และใช้ข้อมูลเชิงลึกเพื่อปรับปรุงการดำเนินงาน โมเดลนี้และการออกแบบสถาปัตยกรรมของ Data Fabric ทำงานร่วมกันอย่างกลมกลืน ผู้ใช้จะต้องใช้โมเดลกระบวนการของ DataOps และทัศนคติของ DataOps เพื่อให้เกิดประโยชน์สูงสุด
หลีกเลี่ยงการสร้าง Data Lake อื่น
เมื่อสร้าง data fabrics ปัญหาทั่วไปคือมันอาจกลายเป็น data lake อื่น หากมีองค์ประกอบทางสถาปัตยกรรมอยู่แล้ว เช่น แหล่งข้อมูล การวิเคราะห์ เทคนิค BI การส่งข้อมูล และการใช้ข้อมูล แต่ขาด API และ SDK ผลลัพธ์จะไม่ใช่โครงสร้างข้อมูลของแท้
คำว่า "data fabric" หมายถึงการออกแบบสถาปัตยกรรมมากกว่าเทคโนโลยีเฉพาะ คุณลักษณะที่แตกต่างของการออกแบบนี้รวมถึงการทำงานร่วมกันของส่วนประกอบและความพร้อมในการผสานรวม ด้วยเหตุนี้ องค์กรจึงต้องจัดลำดับความสำคัญของชั้นการเชื่อมต่อ การส่งข้อมูลที่ราบรื่น และการส่งมอบข้อมูลเชิงลึกอัตโนมัติไปยังอินเทอร์เฟซส่วนหน้าที่เพิ่งเชื่อมต่อใหม่
รับทราบข้อผูกพันด้านกฎระเบียบและการปฏิบัติตามของคุณ
เนื่องจากข้อมูลดำเนินการในวงกว้าง การออกแบบ data fabric จึงสามารถช่วยในการรักษาความปลอดภัย การกำกับดูแล และการปฏิบัติตามกฎระเบียบ ข้อมูลไม่กระจายในหลายระบบ ดังนั้นจึงมีโอกาสน้อยที่ข้อมูลที่ละเอียดอ่อนอาจถูกเปิดเผย

ก่อนที่จะนำไปใช้จริง สิ่งสำคัญคือต้องทำความเข้าใจเกี่ยวกับการปฏิบัติตามกฎระเบียบและข้อบังคับที่บังคับใช้กับข้อมูลของคุณ ข้อมูลประเภทต่างๆ อาจอยู่ภายใต้กรอบการกำกับดูแลและกฎหมาย คุณสามารถจัดการกับสิ่งนี้ได้โดยใช้ขั้นตอนการปฏิบัติตามข้อกำหนดอัตโนมัติที่บังคับให้มีการแปลงข้อมูลตามที่กำหนดเพื่อให้เป็นไปตามข้อกำหนดทางกฎหมาย
ใช้การวิเคราะห์กราฟเพื่อค้นหาการเชื่อมต่อ
ด้วยการใช้กราฟความรู้เพื่อแสดงเมตาดาต้าและความสัมพันธ์ของข้อมูล การวิเคราะห์กราฟจึงเป็นทางเลือกที่ชาญฉลาดกว่าสำหรับฐานข้อมูลเชิงสัมพันธ์ แทนที่จะใช้เฉพาะสตริงข้อความ ระบบจะเติมข้อมูลด้วยบริบทเชิงความหมายเพื่อทำความเข้าใจสิ่งที่ข้อมูลระบุ
กราฟความรู้สามารถนำเสนอข้อมูลเชิงลึกด้านการปฏิบัติงานและธุรกิจโดยการตรวจสอบความเชื่อมโยงระหว่างแหล่งข้อมูล เมื่อเทียบกับวิธีฐานข้อมูลเชิงสัมพันธ์ การรวมข้อมูลที่หลากหลายจะดีกว่า และข้อมูลเชิงลึกที่ค้นพบยังมีประโยชน์ต่อผู้ใช้ทางธุรกิจมากกว่า เนื่องจากเป้าหมายหลักของสถาปัตยกรรมแบบบูรณาการนี้คือการเปิดใช้งานการใช้แหล่งข้อมูลที่หลากหลายโดยไม่ต้องทำซ้ำ กราฟความรู้ที่ขับเคลื่อนโดยการวิเคราะห์กราฟจึงเหมาะอย่างยิ่งสำหรับสิ่งทอข้อมูล
สร้างตลาดข้อมูลสำหรับนักพัฒนาพลเมือง
โดยปกติ สถาปัตยกรรมแบบบูรณาการนี้จะผลิตและส่งข้อมูลเชิงลึกโดยตรงไปยังแอปพลิเคชันทางธุรกิจ หรือสร้างที่เก็บข้อมูลที่กระจัดกระจายสำหรับการตรวจสอบโดยฝ่ายไอทีหรือทีมข้อมูลของคุณ ตลาดข้อมูลที่ทำให้การเข้าถึงเป็นประชาธิปไตยสำหรับนักพัฒนาที่เป็นพลเมืองเป็นอีกวิธีหนึ่งในการใช้ประโยชน์จากความเป็นไปได้
ข้อมูลจากตลาดนี้สามารถใช้เพื่อสร้างรูปแบบใหม่สำหรับกรณีการใช้งานที่เกิดขึ้นใหม่โดยผู้ใช้ทางธุรกิจที่มีความเข้าใจพื้นฐานเกี่ยวกับการวิเคราะห์ข้อมูลและประสบการณ์การวิเคราะห์ธุรกิจหลายปี ธุรกิจสามารถช่วยให้นักพัฒนาที่เป็นพลเมืองใช้งานได้ในรูปแบบใหม่และยืดหยุ่นนอกเหนือจากการพัฒนา BI เฉพาะกรณีการใช้งาน
ใช้เทคโนโลยีโอเพ่นซอร์ส
เมื่อสร้างการประดิษฐ์ข้อมูล โอเพ่นซอร์สสามารถเป็นตัวเปลี่ยนเกมได้ เนื่องจากมีวัตถุประสงค์เพื่อให้ขยายได้และพร้อมสำหรับการผสานรวม เทคโนโลยีโอเพนซอร์สจึงเหมาะสมที่สุดสำหรับสถาปัตยกรรม
เนื่องจากอาจต้องมีการลงทุนจำนวนมาก และคุณต้องการปกป้องการลงทุนนั้นแม้ว่าคุณจะตัดสินใจโอนผู้ให้บริการในภายหลัง ส่วนประกอบโอเพนซอร์สอาจช่วยให้คุณไม่ต้องพึ่งพาผู้ขายรายเดียวน้อยลง อย่าลืมดูโปรเจ็กต์ Open Data Fabric ที่เพิ่งเปิดตัว ซึ่งช่วยให้สามารถประมวลผลไปป์ไลน์การประมวลผลข้อมูลแบบกระจายศูนย์โดยใช้บิ๊กดาต้าและบล็อคเชน
เปิดใช้งานการผลิตโค้ดเนทีฟ
ฟังก์ชันที่สำคัญของโซลูชัน data fabric ของคุณคือการสร้างโค้ดเนทีฟ ซึ่งช่วยให้สร้างโค้ดที่สามารถใช้สำหรับการผสานรวมได้โดยอัตโนมัติ อาจเป็นไปได้ที่จะสร้างโค้ดที่เหมาะสมที่สุดในภาษาต่างๆ รวมถึง Spark, SQL และ Java แม้ว่าจะวิเคราะห์ข้อมูลขาเข้าก็ตาม
ผู้เชี่ยวชาญด้านไอทีสามารถใช้รหัสนี้เพื่อผสานรวมระบบใหม่ที่ API และ SDK อาจยังคงต้องมีให้ใช้งานได้ วิธีนี้จะช่วยให้คุณรวมระบบข้อมูลใหม่ได้อย่างรวดเร็วและง่ายดายโดยไม่ต้องกังวลกับต้นทุนหรือการลงทุนในการรวมที่สูง นอกจากนี้ยังช่วยให้คุณเร่งการเปลี่ยนแปลงทางดิจิทัลของคุณ โปรดจำไว้ว่าการสร้างโค้ดเนทีฟจำเป็นต้องทำงานร่วมกับตัวเชื่อมต่อสำเร็จรูปเพื่อให้ใช้งานง่าย
ปรับปรุงโครงสร้างข้อมูลสำหรับการประมวลผลขอบ
องค์กรต่างๆ อาจใช้อุปกรณ์ IoT ให้เกิดประโยชน์สูงสุดโดยการปรับการประดิษฐ์ข้อมูลให้เข้ากับการประมวลผลแบบเอดจ์ edge-to-cloud data fabric ถูกสร้างมาโดยเฉพาะเพื่อช่วยในการใช้งาน IoT โดยจะย้ายงานที่เกี่ยวข้องกับข้อมูลที่สำคัญออกจากแอปพลิเคชันแบบรวมศูนย์และไปเป็นเลเยอร์ขอบอื่นที่มีการกระจายแต่เชื่อมโยงอย่างใกล้ชิด
ตัวอย่างเช่น โรงงานอัจฉริยะอาจใช้ edge data fabric เพื่อกำหนดน้ำหนักของตู้สินค้าโดยอัตโนมัติ (โดยไม่ต้องติดต่อกับคลาวด์ส่วนกลาง) และเริ่มเลือกขั้นตอน มันอำนวยความสะดวกในการดำเนินการโดยอัตโนมัติและเร่งการตัดสินใจที่ไม่สามารถทำได้ด้วย กระบวนทัศน์ ของ data lake แบบรวมศูนย์แบบเดิม
บทสรุป
สามารถถ่ายโอนข้อมูลได้ตามต้องการระหว่างส่วนประกอบต่างๆ โครงสร้างข้อมูลใช้เพื่อจัดการทรัพยากรและการตั้งค่าทั่วทั้งทรัพยากรทางกายภาพและเสมือนต่างๆ จากที่เดียว ซึ่งช่วยลดปริมาณการจัดการข้อมูลที่จำเป็น
Data Fabric นำเสนอมุมมองที่ครอบคลุมของข้อมูล รวมถึงข้อมูลแบบเรียลไทม์ ซึ่งช่วยลดเวลาที่จำเป็นในการค้นหา สืบค้น และใช้กลยุทธ์ที่สร้างสรรค์ พวกเขายังเสนอการวิเคราะห์ข้อมูลที่ลึกซึ้งยิ่งขึ้นซึ่งช่วยปรับปรุงความฉลาดขององค์กร
ด้วยโซลูชันสำหรับทุกวิชาและอุตสาหกรรม QuestionPro เป็นมากกว่าซอฟต์แวร์สำรวจ พวกเขายังให้บริการการจัดการข้อมูล รวมถึงห้องสมุดการวิจัย InsightsHub ติดต่อกับทีม QuestionPro หากคุณต้องการความช่วยเหลือเกี่ยวกับการสร้างข้อมูล