ปัญหาด้านคุณภาพข้อมูลทั่วไปและวิธีแก้ไข

เผยแพร่แล้ว: 2022-04-12

แม้ว่าเราจะอยู่ในยุคของเทคโนโลยีที่ขับเคลื่อนด้วยข้อมูล แต่โดยทั่วไปแล้วกว่า 50% ของผู้บริหารระดับสูงมักไม่พึงพอใจกับคุณค่าที่ได้รับจากการวิเคราะห์ สาเหตุหลักประการหนึ่งคือ คุณภาพของข้อมูลไม่ดี นอกจากนี้ การมีข้อมูลคุณภาพต่ำในช่วงเริ่มต้นของงานทำให้การดำเนินการต่อไปไม่มีประโยชน์ นอกจากนี้ การตัดสินใจใดๆ จะขึ้นอยู่กับข้อมูลที่ผิดพลาด และสำหรับธุรกิจ เรื่องนี้ย่อมเป็นข่าวร้ายอย่างแน่นอน

นั่นเป็นเหตุผลที่เราตัดสินใจแบ่งปันประสบการณ์และความเชี่ยวชาญด้านข้อมูลมาหลายปี ในปีที่ผ่านมา เราได้พูดคุยกับนักวิเคราะห์หลายคนและได้สัมภาษณ์ผู้เชี่ยวชาญระดับโลกมากมาย ตอนนี้เราต้องการให้คำแนะนำเกี่ยวกับปัญหาที่พบบ่อยที่สุดในการทำงานกับข้อมูลและวิธีแก้ไข

ในบทความ เราจะพูดถึงขั้นตอนของเวิร์กโฟลว์ข้อมูล ข้อผิดพลาดที่อาจเกิดขึ้น และสาเหตุ และที่สำคัญที่สุด เราแบ่งปันแนวทางในการแก้ปัญหาด้านคุณภาพข้อมูล

สารบัญ

  • ปัญหาคุณภาพของข้อมูลมาจากไหน?
    • ขั้นตอนที่ 1 วางแผนการวัด
    • ขั้นตอนที่ 2 รวบรวมข้อมูลหลัก
    • ขั้นตอนที่ 3 ทำให้ข้อมูลดิบเป็นปกติ
    • ขั้นตอนที่ 4 เตรียมข้อมูลให้พร้อมสำหรับธุรกิจ
  • พิจารณาความสัมพันธ์ของคุณกับข้อมูลใหม่ด้วย OWOX BI
    • ขั้นตอนที่ 5. แสดงภาพข้อมูล
  • ประเด็นที่สำคัญ

คำจำกัดความบางอย่างก่อนที่เราจะเริ่ม:

ข้อมูลคุณภาพคืออะไร? โดยสรุป (และในแง่ของข้อมูลการตลาด) ข้อมูล คุณภาพมีความเกี่ยวข้อง เป็นข้อมูลล่าสุดโดยไม่มีข้อผิดพลาดและความคลาดเคลื่อน หากเราค้นหาคุณภาพข้อมูลบน Wikipedia เราจะเห็นคำจำกัดความมากกว่า 10 (!) นอกจากนี้ Wikipedia ยังอ้างอิงงานวิจัยล่าสุดโดย DAMA NL ในคำจำกัดความของมิติข้อมูลคุณภาพโดยใช้ ISO 9001 เป็นกรอบอ้างอิง

ทำไมข้อมูลที่มีคุณภาพจึงเป็นสิ่งจำเป็นสำหรับนักการตลาด นักวิเคราะห์ และผู้มีอำนาจตัดสินใจ? หากปราศจากข้อมูลที่มีคุณภาพและน่าเชื่อถือ การตัดสินใจโดยอาศัยการวิเคราะห์ทางการตลาดก็เป็นไปไม่ได้


ปัญหาคุณภาพของข้อมูลมาจากไหน?

ในการจัดการกับข้อมูลจำนวนมหาศาลที่นักการตลาดและนักวิเคราะห์ใช้ทุกวัน เป็นการท้าทายที่จะขจัดข้อผิดพลาดและความคลาดเคลื่อนโดยสิ้นเชิง เป็นการยากมากที่จะให้ข้อมูลคุณภาพแก่ผู้ใช้ปลายทางทันที อย่างไรก็ตาม ข้อผิดพลาดของข้อมูลสามารถต่อสู้และพบได้ในเชิงรุก ก่อนอื่น มาดูกระบวนการทำงานกับข้อมูลและแยกแยะขั้นตอนที่อาจเกิดปัญหาด้านคุณภาพข้อมูล:

  1. การวางแผนการวัด
  2. การเก็บรวบรวมข้อมูลหลัก
  3. การทำให้เป็นมาตรฐานของข้อมูลดิบ
  4. การเตรียมข้อมูลทางธุรกิจ
  5. การสร้างภาพข้อมูล

จากประสบการณ์ของเรา ข้อผิดพลาดของข้อมูลที่เป็นข้อเท็จจริงมักจะปรากฏในสองขั้นตอนแรก ในขณะที่กรณีของการใช้ข้อมูลในทางที่ผิดเกิดขึ้นบ่อยกว่าในระหว่างขั้นตอนสุดท้าย

เวิร์กโฟลว์การประมวลผลข้อมูล

มาดูรายละเอียดเพิ่มเติมว่าปัญหาด้านคุณภาพข้อมูลใดที่อาจเกิดขึ้นในขั้นตอนเหล่านี้และวิธีแก้ปัญหา

ขั้นตอนที่ 1 วางแผนการวัด

แม้ว่าจะไม่มีข้อผิดพลาดในข้อมูลในขั้นตอนนี้ แต่เราไม่สามารถละเว้นได้อย่างสมบูรณ์ มารอยู่ในรายละเอียด และการรวบรวมข้อมูลสำหรับการวิเคราะห์เริ่มต้นด้วยการวางแผนอย่างละเอียด คำแนะนำของเราคือเริ่มต้นด้วยการวิเคราะห์ด่วนและวางแผนการรวบรวมข้อมูลการตลาดทั้งหมดที่คุณต้องการอย่างรอบคอบ

การข้ามขั้นตอนการวางแผนนำไปสู่แนวทางที่ไม่มีโครงสร้างและมีข้อมูลไม่เพียงพอสำหรับงานหรือโครงการใหม่ ในขณะที่เป้าหมายคือการรวบรวมข้อมูลที่กระจัดกระจายจากแหล่งข้อมูลทั้งหมดที่คุณทำงานด้วย หากคุณไม่มีข้อมูลทั้งหมด จะทำให้การตัดสินใจและการกระทำของคุณผิดพลาดตั้งแต่เริ่มต้น มาดูกันว่าคุณควรรวบรวมข้อมูลใดก่อนเริ่มโครงการใหม่:

  • ข้อมูลพฤติกรรมผู้ใช้จากเว็บไซต์และ/หรือแอปพลิเคชันของคุณ
  • ข้อมูลค่าใช้จ่ายจากแพลตฟอร์มโฆษณา
  • ติดตามการโทร แชทบอท และข้อมูลอีเมล
  • ข้อมูลการขายจริงจากระบบ CRM/ERP ของคุณ ฯลฯ

ขั้นตอนที่ 2 รวบรวมข้อมูลหลัก

เมื่อคุณสร้างแผนการวัดแล้ว ไปที่ขั้นตอนการรวบรวมข้อมูลหลัก ในระหว่างขั้นตอนนี้ ท่ามกลางความท้าทายอื่นๆ ที่คุณต้องเอาชนะ คุณต้องพิจารณาควบคุมการเข้าถึงข้อมูลของคุณ (ทั้งหมดเกี่ยวกับความปลอดภัยของข้อมูล) และเตรียมการล่วงหน้าสำหรับการสร้างพื้นที่จัดเก็บข้อมูลหรือ Data Lake ของคุณ

หากคุณต้องการควบคุมข้อมูลดิบได้อย่างสมบูรณ์โดยไม่ต้องแก้ไข เราขอแนะนำให้ใช้ที่เก็บข้อมูลเดียวพร้อมการนำเข้าข้อมูลอัตโนมัติ สำหรับความต้องการด้านการตลาด Google BigQuery ยังคงเป็นหนึ่งในตัวเลือกที่ดีที่สุด

ปัญหาด้านคุณภาพของข้อมูลที่คุณสามารถพบเจอได้ในขั้นตอนนี้:

1.1 รับข้อมูลที่ไม่สมบูรณ์และไม่ถูกต้องจาก API ของบริการโฆษณา

นี่คืออะไร?

แพลตฟอร์มและบริการการโฆษณารวบรวมข้อมูลพฤติกรรมผู้ใช้ที่มีค่าจำนวนมาก และปัญหาเกิดขึ้นเมื่อคุณพยายามรับข้อมูลทั้งหมดนี้จากแหล่งข้อมูลเหล่านี้โดยไม่ทำลายความสมบูรณ์ของข้อมูล

* Application Programming Interface (API) เป็นส่วนหนึ่งของเซิร์ฟเวอร์ที่ส่งข้อมูล (รับคำขอและส่งการตอบกลับ) โต้ตอบกับผู้ใช้ทุกครั้งที่ผู้ใช้เยี่ยมชมหน้าบนเว็บไซต์ เว็บไซต์สมัยใหม่ส่วนใหญ่ใช้ API ของบุคคลที่สามอย่างน้อยหลายตัว

มีอะไรผิดปกติกับที่?

บริการโฆษณารวบรวมข้อมูลเกี่ยวกับการกระทำของผู้ใช้ อย่างไรก็ตาม ข้อมูลอาจเปลี่ยนแปลงย้อนหลังหลังจากโอนแล้ว และ API ของบริการอาจได้รับการอัปเดตหรือไม่พร้อมใช้งานในบางครั้ง ด้วยเหตุนี้ ข้อมูลบางส่วนจึงไม่ถูกส่ง และคุณภาพโดยรวมของข้อมูลจะเสียหาย นักวิเคราะห์อาจไม่ทราบเรื่องนี้และอาจใช้ข้อมูลที่ไม่เกี่ยวข้องเพื่อเตรียมข้อมูลทางธุรกิจ อย่างไรก็ตาม เป็นไปไม่ได้ที่จะได้รับข้อมูลเชิงลึกที่เป็นประโยชน์หรือทำการตัดสินใจที่ถูกต้องโดยพิจารณาจากข้อมูลที่ไม่สมบูรณ์และ/หรือไม่ถูกต้อง พูดง่ายๆ ก็คือ คุณสามารถลงทุนเวลาและความพยายามอย่างมาก และยังคงพบว่าตัวเองกลับมาอยู่ด้านล่างสุดของบันไดโดยไม่มีข้อมูลที่เป็นประโยชน์หรือข้อพิสูจน์ว่าผลงานประสบความสำเร็จและให้ผลกำไรสำหรับธุรกิจ

อะไรคือเหตุผล?

ข้อมูลอาจไม่สมบูรณ์หรือไม่ถูกต้องเนื่องจากการสูญหายของข้อมูล ความคลาดเคลื่อน หรือข้อมูลซ้ำซ้อน สาเหตุทั่วไปของปัญหาเหล่านี้ได้แก่:

  • บัญชีใหม่บนแพลตฟอร์มโฆษณาจะถูกสร้างขึ้น แต่นักวิเคราะห์จะไม่ได้รับแจ้งและข้อมูลจะไม่ถูกเก็บรวบรวม
  • API ไม่รองรับพารามิเตอร์ไดนามิกในแท็ก UTM และไม่รวบรวมหรือถ่ายโอน หากคุณใช้พารามิเตอร์ที่ไม่รองรับในแท็ก UTM คุณจะเห็นชื่อพารามิเตอร์แทนที่จะเป็นค่า เช่น {{geo}} แทนที่จะเป็นชื่อแคมเปญจริง
  • อัพเดทข้อมูลย้อนหลัง. บริการโฆษณามักจะอัปเดตข้อมูลย้อนหลัง (เกี่ยวกับต้นทุน การคลิก และการแสดงผลในบัญชีการโฆษณา) อย่างไรก็ตาม ไม่ใช่นักวิเคราะห์ทุกคนที่ทราบเรื่องนี้และนำมาพิจารณา

จะแก้ปัญหานี้อย่างไร?

เนื่องจากเป็นไปไม่ได้ที่จะควบคุมโค้ดโดยตรงเมื่อทำงานกับ API คุณจึงสามารถจัดการกับปัญหาเหล่านี้ได้โดย:

  • กระจายพื้นที่ความรับผิดชอบในระหว่างการรวบรวมข้อมูลเพื่อให้สามารถควบคุมการเก็บเกี่ยวข้อมูลได้ดีขึ้น
  • โดยใช้เครื่องมือนำเข้าข้อมูลอัตโนมัติที่รองรับการเปลี่ยนแปลง API พารามิเตอร์แบบไดนามิก ฯลฯ ในกรณีที่ไม่มีข้อมูล เครื่องมือเหล่านี้สามารถแสดงช่องว่างข้อมูลที่มีอยู่และดาวน์โหลดข้อมูลย้อนหลังได้

1.2 การรับข้อมูลที่ไม่สมบูรณ์และไม่ถูกต้องจากเว็บไซต์

นี่คืออะไร?

การวิเคราะห์ข้อมูลจากบริการโฆษณาทำให้เราทราบว่าเราใช้เงินไปกับการโฆษณาเป็นจำนวนเท่าใด จากข้อมูลพฤติกรรมผู้ใช้เว็บไซต์ เราได้รับข้อมูลเกี่ยวกับรายได้ที่เราได้รับ เนื่องจากคำถามทางธุรกิจมักจะฟังดูเหมือน "โฆษณาใดให้ผลตอบแทน อันใดไม่ได้ผล" จำเป็นต้องทราบอัตราส่วนรายได้/ค่าใช้จ่าย

มีอะไรผิดปกติกับที่?

ข้อมูลพฤติกรรมผู้ใช้เว็บไซต์แตกต่างจากข้อมูลต้นทุนที่รวบรวมโดยบริการโฆษณา เนื่องจากข้อมูลพฤติกรรมผู้ใช้เว็บไซต์:

  • ถูกรวบรวมโดยเจ้าของเว็บไซต์โดยตรง
  • มีปริมาณมากกว่าข้อมูลต้นทุนจากบริการโฆษณาอย่างมาก

นอกจากนี้ หากเราไม่สังเกตเห็นว่าไม่มีการรวบรวมข้อมูลพฤติกรรมของผู้ใช้และเราไม่ขจัดปัญหา ข้อมูลนี้จะสูญหายไปตลอดกาล

เช่นเดียวกับปัญหาการเก็บรวบรวมข้อมูลจาก API ของบริการโฆษณา ข้อมูลที่ไม่สมบูรณ์หรือไม่ถูกต้องนำไปสู่แนวทางแก้ไขที่ผิดพลาด การตัดสินใจด้านการจัดการที่ไม่ถูกต้องก็นำไปสู่การสูญเสียรายได้

อะไรคือเหตุผล?

ข้อผิดพลาดอาจเกิดขึ้นเมื่อรวบรวมข้อมูลเว็บไซต์เนื่องจาก:

  • หน้าเว็บไซต์บางหน้าไม่มีคอนเทนเนอร์ Google Tag Manager (GTM) GTM รวบรวมผลลัพธ์ของแคมเปญโฆษณาและข้อมูลพฤติกรรมผู้ใช้ ดังนั้น หากไม่มีคอนเทนเนอร์ GTM ในหน้า ก็จะไม่มีการรวบรวมข้อมูล
  • โปรเจ็กต์ Google Cloud ไม่ได้รับเงินตรงเวลา ดังนั้นการเก็บรวบรวมข้อมูลจึงถูกระงับ
  • ความถูกต้องของข้อมูลที่กรอกลงในแบบฟอร์มใบสมัครโดยผู้ใช้เว็บไซต์ (ชื่อ ที่อยู่ อีเมล ฯลฯ) ไม่ผ่านการตรวจสอบ

จะแก้ปัญหานี้อย่างไร?

เช่นเดียวกับการรวบรวมข้อมูลจาก API โซลูชันสำหรับการรวบรวมข้อมูลเว็บไซต์ประกอบด้วย:

  • กระจายพื้นที่ความรับผิดชอบในระหว่างการรวบรวมข้อมูลเพื่อให้สามารถควบคุมการเก็บเกี่ยวข้อมูลได้ดีขึ้น
  • การใช้เครื่องมือนำเข้าข้อมูลอัตโนมัติ ในกรณีที่ไม่มีข้อมูล เครื่องมือเหล่านี้สามารถเตือนคุณถึงข้อผิดพลาดของข้อมูลที่มีอยู่ได้

2. การรวบรวมข้อมูลตัวอย่าง

นี่คืออะไร?

ข้อมูลที่รวบรวมและสุ่มตัวอย่างเป็นข้อมูลทั่วไปที่ปรากฏขึ้นในกรณีที่ข้อมูลทั้งหมดไม่ได้รับการประมวลผลและใช้สำหรับการวิเคราะห์และการรายงาน สิ่งนี้จะเกิดขึ้นเมื่อบริการต่างๆ เช่น Google Analytics วิเคราะห์ข้อมูลเพียงบางส่วนเพื่อลดภาระงานบนเซิร์ฟเวอร์ และสร้างสมดุลระหว่างความเร็วและความแม่นยำของการประมวลผลข้อมูล เนื่องจากการสุ่มตัวอย่างส่งผลให้เกิดลักษณะทั่วไป จึงนำไปสู่การขาดความเชื่อมั่นในผลลัพธ์ที่ได้รับ

มีอะไรผิดปกติกับที่?

รายงานตัวอย่างบิดเบือนข้อมูลประสิทธิภาพ และนั่นอาจทำให้คุณเสียค่าใช้จ่ายมหาศาลเมื่อพูดถึงเมตริกที่เกี่ยวข้องกับเงิน เช่น เป้าหมาย Conversion และรายได้ ด้วยเหตุนี้ คุณจึงเสี่ยงที่จะไม่สังเกตเห็นแคมเปญโฆษณาที่สร้างผลกำไรและอาจปิดลงเนื่องจากข้อมูลที่บิดเบี้ยวในรายงาน หรือในทางกลับกัน คุณอาจใช้เงินทั้งหมดไปกับแคมเปญที่ไม่มีประสิทธิภาพ

กล่าวอีกนัยหนึ่ง ทุกครั้งที่ใช้การสุ่มตัวอย่าง มีความเสี่ยงที่จะได้ผลลัพธ์ที่ไม่ถูกต้อง และหากคุณพยายามตัดสินใจโดยใช้ข้อมูลเพียงบางส่วน แสดงว่าคุณกำลังเล่นเกมเดาด้วยงบประมาณของบริษัท

อะไรคือเหตุผล?

ในความพยายามที่จะสร้างรายงานโดยเร็วที่สุดและประหยัดทรัพยากร ระบบจะใช้การสุ่มตัวอย่าง การรวมและการกรอง แทนการประมวลผลอาร์เรย์ข้อมูลขนาดใหญ่

จะแก้ปัญหานี้อย่างไร?

สิ่งเดียวที่คุณสามารถทำได้เพื่อหลีกเลี่ยงการสุ่มตัวอย่างข้อมูลคือการรวบรวมข้อมูลดิบและตรวจสอบความสมบูรณ์ของข้อมูลอย่างต่อเนื่องตลอดทั้งรายงานของคุณ การตรวจสอบกระบวนการนี้ควรทำโดยอัตโนมัติเพื่อหลีกเลี่ยงปัจจัยมนุษย์ ตัวอย่างเช่น คุณสามารถใช้การทดสอบอัตโนมัติของคอลเลกชันตัววัดที่ถูกต้องบนเว็บไซต์ของคุณ เช่นเดียวกับที่ OZON ทำโดยใช้ OWOX BI

ขั้นตอนที่ 3 ทำให้ข้อมูลดิบเป็นปกติ

หลังจากรวบรวมข้อมูลที่จำเป็นทั้งหมดแล้วก็ถึงเวลาทำให้เป็นมาตรฐาน ในขั้นตอนนี้ นักวิเคราะห์จะเปลี่ยนข้อมูลที่มีอยู่ให้อยู่ในแบบฟอร์มที่ธุรกิจกำหนด ตัวอย่างเช่น เราต้องทำให้หมายเลขโทรศัพท์อยู่ในรูปแบบเดียว

การปรับข้อมูลให้เป็นมาตรฐานคือ "งานลิง" แบบแมนนวลและแบบประจำ ซึ่งมักจะป้องกันไม่ให้นักวิเคราะห์จากงานที่น่าตื่นเต้นมากขึ้น เช่น การดึงข้อมูลเชิงลึกที่เป็นประโยชน์ ไม่ต้องพูดถึงว่าปัญหาในการทำให้เป็นมาตรฐานมักใช้เวลานานถึง 50% ของเวลาทำงานของนักวิเคราะห์โดยรวม

ปัญหาด้านคุณภาพข้อมูลที่สามารถพบได้ในขั้นตอนนี้:

1. การแทรก อัปเดต และการลบการอ้างอิง

นี่คืออะไร?

สิ่งเหล่านี้เป็นผลข้างเคียงที่เป็นปัญหาซึ่งปรากฏขึ้นในระหว่างการทำให้ข้อมูลที่ไม่มีโครงสร้างเป็นมาตรฐาน

มีอะไรผิดปกติกับที่?

ผลลัพธ์ทั่วไปของการพึ่งพาข้อมูลเหล่านี้คือระบบการรายงานจะละทิ้งข้อมูลที่ไม่ถูกต้องดังกล่าวขณะวิเคราะห์ ด้วยเหตุนี้ เราจึงได้รับรายงานที่ไม่ถูกต้องซึ่งไม่ได้อิงตามข้อมูลทั้งหมด ตัวอย่างเช่น สมมติว่าเรามีวัตถุเซสชันและวัตถุโฆษณา ในเซสชัน เรามีข้อมูลสำหรับวันที่ 10 ถึง 20 และในโฆษณา มีข้อมูลจากวันที่ 10 ถึง 15 (ด้วยเหตุผลบางประการ จะไม่มีข้อมูลค่าใช้จ่ายสำหรับวันที่ 16 ถึง 20) ดังนั้น เราจึงสูญเสียข้อมูลจากโฆษณาในวันที่ 16 ถึง 20 หรือข้อมูลจากเซสชันจะใช้ได้เฉพาะในวันที่ 10 ถึง 15 เท่านั้น

อะไรคือเหตุผล?

ผลข้างเคียงที่ไม่พึงประสงค์ปรากฏขึ้นเมื่อ API บริการโฆษณามีการเปลี่ยนแปลง ไม่พร้อมใช้งาน หรือส่งคืนข้อมูลที่ไม่ถูกต้อง

จะแก้ปัญหานี้อย่างไร?

ในทำนองเดียวกัน คุณตรวจสอบข้อผิดพลาดในการรวบรวมข้อมูล คุณควรตรวจสอบข้อมูลที่คุณทำงานด้วยเสมอ นอกจากนี้ หากผู้ใช้ไม่ทราบข้อมูลเฉพาะของการผสานข้อมูล ก็มีโอกาสเกิดข้อผิดพลาดขึ้นได้ขณะทำให้ข้อมูลเป็นมาตรฐาน ในทางปฏิบัติ การตัดสินใจที่ดีที่สุดในขั้นตอนนี้คือการพัฒนาระบบตรวจสอบคุณภาพข้อมูลที่แจ้งเตือนผู้รับผิดชอบด้านคุณภาพข้อมูลในกรณีที่ข้อมูลมีความผิดปกติ สำหรับสิ่งนี้ คุณสามารถใช้บริการต่างๆ เช่น OWOX BI พร้อมฟังก์ชันการตรวจสอบข้อมูลที่ฝังตัว

ลูกค้าของเรา
เติบโต เร็วขึ้น 22%

เติบโตเร็วขึ้นด้วยการวัดว่าอะไรทำงานได้ดีที่สุดในการทำการตลาดของคุณ

วิเคราะห์ประสิทธิภาพทางการตลาดของคุณ ค้นหาพื้นที่การเติบโต เพิ่ม ROI

รับการสาธิต

2. รูปแบบข้อมูล โครงสร้าง และระดับของรายละเอียดต่างๆ

นี่คืออะไร?

แพลตฟอร์มหรือบริการโฆษณาแต่ละแห่งใช้รูปแบบข้อมูล สกุลเงิน และโครงสร้างที่แตกต่างกัน ดังนั้น หลังจากที่รวบรวมข้อมูลจากทุกแหล่งแล้ว คุณต้องทำให้เป็นมาตรฐานในรูปแบบ/โครงสร้างเดียว

มีอะไรผิดปกติกับที่?

การสร้างป้อมปราการสามเหลี่ยมเป็นเรื่องยากเมื่อคุณมีเป็นชิ้นกลมและวงรี เมื่อคุณมีชุดข้อมูลจำนวนมากในรูปแบบต่างๆ คุณจะไม่สามารถสร้างรายงานก่อนที่จะรวมข้อมูลได้

อะไรคือเหตุผล?

มีรูปแบบข้อมูลที่แตกต่างกันในบริการโฆษณา ตัวอย่างเช่น คอลัมน์เดียวกันในแพลตฟอร์มต่างๆ สามารถตั้งชื่อ Product Name และ Product Category ได้ อีกตัวอย่างหนึ่งคือการใช้สกุลเงินที่แตกต่างกันในข้อมูลต้นทุน เช่น ดอลลาร์สำหรับโฆษณา Twitter และปอนด์บน Facebook เป็นต้น


จะแก้ปัญหานี้อย่างไร?

ก่อนวิเคราะห์ข้อมูลจะต้องแปลงเป็นรูปแบบเดียว มิฉะนั้นจะไม่มีอะไรดีออกมาจากการวิเคราะห์ของคุณ ตัวอย่างเช่น คุณควรรวมข้อมูลเซสชันผู้ใช้กับข้อมูลค่าโฆษณาเพื่อวัดผลกระทบของแหล่งที่มาของการเข้าชมหรือช่องทางการตลาดแต่ละแห่ง และเพื่อดูว่าแคมเปญโฆษณาใดทำให้คุณมีรายได้มากขึ้น แน่นอนว่าสามารถทำได้ด้วยตนเองโดยใช้สคริปต์และ SQL แต่การใช้โซลูชันอัตโนมัติเป็นทางเลือกที่ดีกว่า

ขั้นตอนที่ 4 เตรียมข้อมูลให้พร้อมสำหรับธุรกิจ

ข้อมูลที่พร้อมสำหรับธุรกิจคือชุดข้อมูลสุดท้ายที่สะอาดหมดจดในโครงสร้างที่สอดคล้องกับรูปแบบธุรกิจ กล่าวอีกนัยหนึ่ง หากคุณได้ทำตามขั้นตอนทั้งหมดในการทำงานกับข้อมูลและทำทุกอย่างเสร็จสิ้นแล้ว คุณควรได้รับชุดข้อมูลสุดท้าย ข้อมูลสำเร็จรูปที่สามารถส่งไปยังบริการสร้างภาพข้อมูล (Power BI, Tableau, Google Data Studio เป็นต้น)

อย่างไรก็ตาม คุณไม่ควรสับสนกับข้อมูลดิบที่คุณสามารถลองสร้างรายงานได้ เป็นวิธีการที่ผิดพลาดซึ่งจะนำมาซึ่งปัญหาที่เกิดซ้ำหลายครั้ง: การค้นหาข้อผิดพลาดและสาเหตุของความคลาดเคลื่อนจะใช้เวลานาน และตรรกะทางธุรกิจจะต้องทำซ้ำอย่างต่อเนื่องในการสืบค้น SQL ทั้งหมด แน่นอนว่าปริมาณข้อมูลดิบที่ไม่มีโครงสร้างดังกล่าวเป็นสิ่งที่ท้าทายในการติดตามข้อมูลล่าสุดและควบคุมการเปลี่ยนแปลงในตรรกะของการแปลง ตัวอย่างเช่น คุณอาจประสบปัญหาเช่นการอัปเดตประวัติข้อมูลค่าใช้จ่ายหลังจากที่บริการโฆษณามีการปรับเปลี่ยน อีกตัวอย่างหนึ่งอาจเป็นการซื้อคืนธุรกรรมที่เสร็จสมบูรณ์ ในกรณีนี้ ต้องใช้เวลาทำความเข้าใจว่าธุรกรรมนั้นได้รับการแลกแล้วหรือไม่ แต่เราต้องระบุสถานะนี้กับช่วงเวลาที่สั่งซื้อ

ขออภัย เป็นเรื่องปกติที่จะข้ามขั้นตอนนี้และเข้าสู่การสร้างรายงานทันที อย่างไรก็ตาม ประสบการณ์ของเราแสดงให้เห็นว่าการใช้ชุดข้อมูลสุดท้ายและการเตรียมข้อมูลที่พร้อมสำหรับธุรกิจสำหรับโลกสมัยใหม่ของการวิเคราะห์เป็นสิ่งที่จำเป็น ในระยะยาว การทำงานกับข้อมูลที่เตรียมไว้จะถูกกว่าและง่ายกว่า แทนที่จะเรียกใช้ข้อมูลดิบที่ทำสิ่งเดิมซ้ำแล้วซ้ำอีก

ปัญหาด้านคุณภาพของข้อมูลที่อาจปรากฏขึ้นในระหว่างขั้นตอนนี้:


1. การขาดคำจำกัดความของข้อมูลทำให้เกิดความคลาดเคลื่อน

นี่คืออะไร?

เป็นการยากที่จะควบคุมการเปลี่ยนแปลงในตรรกะของการแปลงเนื่องจากคำจำกัดความประเภทข้อมูลที่จำเป็นไม่สอดคล้องหรือขาดหายไปในการประมวลผลข้อมูล

มีอะไรผิดปกติกับที่?

เมื่อข้อมูลไม่ได้ถูกกำหนดไว้อย่างชัดเจน ผู้ใช้จะไม่อยู่ในหน้าเดียวกันเกี่ยวกับการใช้ข้อมูล: พวกเขาไม่แน่ใจว่าตารางหรือคอลัมน์ใดที่จะสืบค้น ใช้ตัวกรองใด หรือใครที่จะขอข้อมูลเกี่ยวกับวัตถุข้อมูล นอกจากนี้ ใช้เวลานานเกินไปในการนำทางและทำความเข้าใจออบเจ็กต์ข้อมูลทั้งหมดจากข้อมูลดิบ รวมถึงแอตทริบิวต์ ตำแหน่งในโมเดลข้อมูล และความเกี่ยวข้องซึ่งกันและกัน

อะไรคือเหตุผล?

ธุรกิจไม่ได้กำหนดข้อมูลหลักและรูปแบบข้อมูลอย่างชัดเจน ดังนั้น ตรรกะในการรวมข้อมูลจึงเข้าใจยาก

จะแก้ปัญหานี้อย่างไร?

ก่อนอื่น อย่าใช้ตรรกะทางธุรกิจกับแต่ละรายงานหรือชุดข้อมูล แต่ใช้การสร้างแบบจำลองข้อมูลในระดับบริษัท ภายในบริษัท ควรมีรูปแบบข้อมูลธุรกิจที่โปร่งใสและการควบคุมวงจรชีวิตของข้อมูล ซึ่งหมายความว่าคำจำกัดความทั้งหมดที่ใช้ต้องมีความชัดเจน ตัวอย่างเช่น ผู้ใช้ปลายทางควรทราบว่าการวัด Conversion และผู้เข้าชมเว็บไซต์เป็นอย่างไร

นอกจากนั้น เนื่องจากเป็นการท้าทายในการเตรียมและบำรุงรักษาข้อมูลจำลองที่เป็นปัจจุบัน คำตอบอยู่ที่การใช้โซลูชันอัตโนมัติ (เช่น เครื่องมือสร้างข้อมูล (dbt)) ที่สามารถรวบรวม ล้าง ทำให้เป็นปกติ และตรวจสอบคุณภาพของข้อมูลของคุณ ดังนั้นจึงพร้อมสำหรับธุรกิจ


พิจารณาความสัมพันธ์ของคุณกับข้อมูลใหม่ด้วย OWOX BI

ทีมงาน OWOX BI รู้มากกว่าใครๆ ว่าปัญหาข้อมูลมีความรุนแรงเพียงใด เนื่องจากลูกค้าของเราแต่ละคนต้องเผชิญปัญหา เราได้สร้างผลิตภัณฑ์ที่ช่วยให้นักวิเคราะห์สามารถทำกิจวัตรประจำวันได้โดยอัตโนมัติ ส่งมอบคุณค่าทางธุรกิจจากข้อมูล และรับรองคุณภาพของข้อมูล

OWOX BI เป็นแพลตฟอร์มแบบครบวงจรที่ช่วยให้คุณรวบรวม จัดเตรียม และวิเคราะห์ข้อมูลการตลาดทั้งหมดของคุณ มันทำการส่งข้อมูลอัตโนมัติจากแหล่งที่มาแบบแยกส่วนไปยังปลายทางการวิเคราะห์ของคุณ ทำให้มั่นใจได้ว่าข้อมูลจะถูกต้องและเป็นปัจจุบันอยู่เสมอ

เมื่อใช้ OWOX BI คุณจะได้รับข้อมูลที่พร้อมสำหรับธุรกิจตามรูปแบบธุรกิจของคุณด้วยการตรวจสอบคุณภาพข้อมูลที่โปร่งใสและเครื่องมือสร้างรายงานที่ใช้งานง่ายสำหรับการปลดล็อกข้อมูลเชิงลึกโดยไม่ต้องใช้ SQL หรือโค้ด

มาดูกันว่า OWOX BI สามารถช่วยคุณในทุกขั้นตอนที่เรากล่าวถึงข้างต้นได้อย่างไร

  • วางแผนการวัดของคุณ สร้างแผนการวัดผลสำหรับธุรกิจของคุณหรือพัฒนาระบบเมตริกโดยเฉพาะอย่างยิ่งสำหรับความต้องการทางธุรกิจของคุณด้วยความช่วยเหลือจากผู้เชี่ยวชาญของเรา
  • รวบรวมข้อมูลเบื้องต้น OWOX BI รวบรวมข้อมูลดิบจาก Google Analytics บริการโฆษณา เว็บไซต์ ร้านค้าออฟไลน์ ระบบติดตามการโทร และระบบ CRM ในการจัดเก็บข้อมูลของคุณ แพลตฟอร์มทำงานได้อย่างราบรื่นกับบัญชีโฆษณาขนาดใหญ่ และอัปโหลดข้อมูลทั้งหมดโดยไม่คำนึงถึงจำนวนแคมเปญ นอกจากการนำเข้าข้อมูลต้นทุนโดยอัตโนมัติแล้ว OWOX BI ยังรับรู้พารามิเตอร์ไดนามิกในแท็ก UTM แปลงต้นทุนเป็นสกุลเงินเดียว และตรวจสอบความเกี่ยวข้องของข้อมูล

คุณไม่จำเป็นต้องมองหาตัวเชื่อมต่อต่างๆ อีกต่อไป และหากจำเป็น ทีมงานของเราสามารถตั้งค่าการผสานการทำงานแบบกำหนดเองให้กับคุณได้

  • ทำให้ข้อมูลดิบ เป็นมาตรฐาน เมื่อใช้ OWOX BI คุณไม่จำเป็นต้องทำความสะอาด จัดโครงสร้าง และประมวลผลข้อมูลด้วยตนเอง คุณจะได้รับชุดข้อมูลที่พร้อมในโครงสร้างที่ชัดเจนและสะดวกที่สุด นอกจากนี้ คุณสามารถรับรายงานภาพเกี่ยวกับความเกี่ยวข้องของข้อมูลจากบริการโฆษณาที่อัปโหลดไปยัง Google Analytics ได้ทุกเมื่อ

  • เตรียมข้อมูลทางธุรกิจ ด้วย OWOX BI คุณจะเชื่อถือข้อมูลที่พร้อมสำหรับธุรกิจได้เพียงปลายนิ้วสัมผัส ไม่จำเป็นต้องสร้างชุดข้อมูลใหม่สำหรับรายงานใหม่ทุกฉบับอีกต่อไป เนื่องจากคุณจะได้รับชุดข้อมูลสุดท้ายที่สร้างไว้ล่วงหน้าซึ่งจัดเตรียมตามแบบจำลองข้อมูลธุรกิจของคุณ ด้วยข้อมูลที่เป็นปัจจุบันและเป็นหนึ่งเดียวที่พร้อมสำหรับการแบ่งกลุ่มข้อมูลเพิ่มเติม คุณจะได้รับข้อมูลเชิงลึกเกี่ยวกับความเร็วของธุรกิจของคุณและเพิ่มมูลค่าของข้อมูลของคุณ


  • เห็น ภาพข้อมูล แพลตฟอร์ม OWOX BI ให้คุณวิเคราะห์และแสดงภาพข้อมูลของคุณได้ทุกที่ที่คุณต้องการ เมื่อข้อมูลการตลาดของคุณพร้อมแล้ว คุณสามารถส่งไปยัง BI หรือเครื่องมือสร้างภาพที่คุณต้องการได้ด้วยการคลิกเพียงไม่กี่ครั้ง

จองการสาธิตฟรีเพื่อดูว่า OWOX BI รับประกันคุณภาพข้อมูลอย่างไรและคุณจะได้รับประโยชน์จากการจัดการข้อมูลอัตโนมัติเต็มรูปแบบได้อย่างไรในวันนี้

จองการสาธิต

ขั้นตอนที่ 5. แสดงภาพข้อมูล

การนำเสนอเมตริกหลักด้วยสายตาเป็นขั้นตอนสุดท้ายในการทำให้ข้อมูลทำงาน ดังนั้นการนำเสนอข้อมูลของคุณควรมีทั้งข้อมูลและใช้งานง่าย การแสดงภาพอัตโนมัติและกำหนดค่าอย่างเหมาะสมสามารถลดเวลาในการค้นหาปัญหาได้อย่างมาก นั่นคือ คุณสามารถทำซ้ำได้มากขึ้นโดยใช้ความพยายามน้อยลงในช่วงเวลาเดียวกันเพื่อปรับปรุงคุณภาพข้อมูล

นอกจากนี้ สิ่งสำคัญคือต้องจดจำบริการสร้างภาพข้อมูล เช่น Google Data Studio ยอดนิยมไม่สามารถผสานหรือแปลงข้อมูลได้ หากคุณต้องการรายงานโดยอิงจากแหล่งข้อมูลจำนวนมาก คำแนะนำของเราคือรวบรวมข้อมูลทั้งหมดที่คุณต้องการไว้ล่วงหน้าในที่จัดเก็บข้อมูลเดียวเพื่อหลีกเลี่ยงปัญหาใดๆ

ปัญหาด้านคุณภาพของข้อมูลที่คุณสามารถพบได้ในขั้นตอนนี้:

1. ความผิดพลาดของข้อมูลข้อเท็จจริง

เหล่านี้คืออะไร?

เมื่อมีสิ่งผิดปกติเกิดขึ้นที่ระดับก่อนหน้าของการรวบรวมข้อมูลและการทำให้เป็นมาตรฐาน ข้อผิดพลาดของข้อมูลอาจจบลงในรายงานที่แสดงโดยบริการการแสดงภาพข้อมูล

มีอะไรผิดปกติกับที่?

รายงานที่สร้างขึ้นโดยมีข้อผิดพลาดของข้อมูลที่เป็นข้อเท็จจริงทำให้เสียเวลาและเงินไปเปล่าๆ พวกเขาไม่ได้ให้ผลกำไรหรือข้อมูลเชิงลึกอันมีค่าเกี่ยวกับโซนความเสี่ยงและการเติบโตของธุรกิจ ขอโทษนะ Mario แต่เจ้าหญิงอยู่ในปราสาทอื่น!

อะไรคือเหตุผล?

พูดง่ายๆ ก็คือ ข้อมูลที่แสดงเป็นภาพนั้นไม่เกี่ยวข้อง อย่างไรก็ตาม หากต้องการทราบสาเหตุของข้อผิดพลาด คุณควรกลับไปตรวจสอบข้อมูลของคุณอีกครั้ง

จะแก้ปัญหานี้อย่างไร?

วิธีเดียวในการแก้ปัญหานี้คือการเตรียมข้อมูลอย่างละเอียดและตรวจสอบคุณภาพก่อนสร้างรายงาน

2. แบบสอบถาม SQL ที่ใช้งานไม่ได้หรือการแก้ไขรายงานมากเกินไป (และ/หรือแบบสอบถาม SQL)

นี่คืออะไร?

ความต้องการข้อมูลเปลี่ยนแปลงตลอดเวลา และการสืบค้น SQL ก็เปลี่ยนแปลงเช่นกัน ด้วยเหตุนี้ ยิ่งระบบการรายงานมีความซับซ้อนมากเท่าใด ก็ยิ่งทำลายระบบได้ง่ายขึ้นเท่านั้น

มีอะไรผิดปกติกับที่?

ไม่มีอะไรผิดปกติกับการเปลี่ยนแปลง เว้นแต่จะมีหลายอย่างจนจำไม่ได้ว่ามีการเปลี่ยนแปลงอะไร ที่ไหน และเมื่อไหร่ ในที่สุด ระบบการรายงานที่สร้างขึ้นอย่างระมัดระวังทั้งหมดสามารถหายไปได้ เนื่องจากแบบสอบถาม SQL ไม่ทำงาน และไม่มีข้อมูลที่ถูกต้องที่จะแสดงเป็นภาพ

อะไรคือเหตุผล?

การจดจำสิ่งเล็กน้อยทุกอย่างค่อนข้างท้าทาย ดังนั้นข้อผิดพลาดทั่วไปคือการลืมใช้การแก้ไขกับชุดข้อมูลทั้งหมดที่จำเป็น

จะแก้ปัญหานี้อย่างไร?

ตามหลักการแล้ว ผู้ใช้ควรสามารถสร้างรายงานทางการตลาดได้โดยไม่ต้องใช้แบบสอบถาม SQL จำนวนมาก และไม่จำเป็นต้องใช้การเปลี่ยนแปลงและ/หรือการแก้ไขมากมาย

3. ความเข้าใจผิดและการใช้ข้อมูลที่เก็บรวบรวมในทางที่ผิด

นี่คืออะไร?

ปัญหาที่พบบ่อยที่สุดประการหนึ่งคือการเข้าใจผิดข้อมูล (และด้วยเหตุนี้ การใช้ข้อมูลในทางที่ผิด) กรณีนี้เกิดขึ้นเมื่อเมตริกหรือพารามิเตอร์หนึ่งๆ สามารถตีความได้มากกว่าหนึ่งวิธี ตัวอย่างเช่น สมมติว่ามีเมตริก Conversion ในรายงานและผู้ใช้ต่างๆ ใช้รายงานนี้ ผู้ใช้รายหนึ่งคิดว่า Conversion หมายถึงการเข้าชมเว็บไซต์ ในขณะที่อีกคนหนึ่งคิดว่าหมายถึงการสั่งซื้อ อย่างไรก็ตาม ยังมีบุคคลที่สามที่คิดว่าการวัด Conversion นี้เป็นเรื่องเกี่ยวกับใบสั่งซื้อที่จัดส่งและที่สั่งซื้อ อย่างที่คุณเห็น มีการตีความที่เป็นไปได้มากมาย ดังนั้นคุณต้องทำให้ชัดเจนว่าข้อมูลใดที่นำเสนอในรายงาน

มีอะไรผิดปกติกับที่?

หากไม่มีความเข้าใจที่ชัดเจนว่าข้อมูลใดที่ใช้ในรายงานและแดชบอร์ด ก็ไม่รับประกันว่าการตัดสินใจของคุณจะอิงตามข้อเท็จจริง

อะไรคือเหตุผล?

คำอธิบายที่ไม่ชัดเจนของตัวชี้วัดและพารามิเตอร์ที่ใช้ในรายงานหรือประเภทการแสดงข้อมูลที่ไม่เหมาะสมอาจนำไปสู่การตัดสินใจที่ไม่ดี

จะแก้ปัญหานี้อย่างไร?

การยืนยันข้อมูลจะไม่สิ้นสุดเมื่อคุณแน่ใจว่าข้อมูลที่ป้อนถูกต้องและมีความเกี่ยวข้อง ข้อมูลนี้ยังคงถูกใช้ในทางที่ผิด เพื่อหลีกเลี่ยงปัญหานี้ ผู้ใช้ปลายทางต้องมีสิทธิ์เข้าถึงข้อมูลที่ครบถ้วน ทันสมัย ​​และพร้อมสำหรับธุรกิจ พร้อมคำอธิบายที่ชัดเจนและแม่นยำว่าข้อมูลใดบ้างที่นำเสนอในรายงาน


ลูกค้าของเรา
เติบโต เร็วขึ้น 22%

เติบโตเร็วขึ้นด้วยการวัดว่าอะไรทำงานได้ดีที่สุดในการทำการตลาดของคุณ

วิเคราะห์ประสิทธิภาพทางการตลาดของคุณ ค้นหาพื้นที่การเติบโต เพิ่ม ROI

รับการสาธิต

ประเด็นที่สำคัญ

การวิเคราะห์คุณภาพเริ่มต้นด้วยข้อมูลคุณภาพ ความพยายามด้านข้อมูลของคุณควรมีคุณค่าและเชื่อถือได้ นั่นคือเหตุผลที่คุณควรระบุในเชิงรุกและต่อสู้กับข้อผิดพลาดของข้อมูลและความคลาดเคลื่อนเพื่อรับการรายงานประสิทธิภาพแบบองค์รวมและปรับปรุงคุณภาพของข้อมูลของคุณ โดยทั่วไป การปรับปรุงคุณภาพข้อมูลเป็นกระบวนการที่ทำซ้ำได้ซึ่งสามารถแยกแยะได้สามขั้นตอน:

  1. การตรวจสอบสถานะของข้อมูลของคุณ
  2. การแปลปัญหาที่ทำให้คุณภาพข้อมูลลดลง
  3. แก้ไขปัญหา

ใช้เวลามากที่สุดคือสองขั้นตอนแรก เป็นการยากที่จะระบุว่ามีปัญหาเกิดขึ้นและเข้าใจว่าเกิดข้อผิดพลาดในสถานการณ์ใด หลังจากที่ได้ชัดเจนว่าปัญหาคืออะไรและอยู่ที่ใด กลับกลายเป็นว่าแก้ไขได้ง่ายทีเดียว

สุดท้าย คุณสามารถสร้างเอกสารสามฉบับเพื่อปรับปรุงข้อมูลของคุณ:

  • แผนการเคลื่อนไหวข้อมูล
  • เมทริกซ์ความรับผิดชอบ (ใครรับผิดชอบอะไร)
  • โมเดลข้อมูลธุรกิจ