วิธีการส่งออกข้อมูลดิบจาก Google Analytics
เผยแพร่แล้ว: 2022-04-12ทำไมคุณต้องรวบรวมข้อมูลดิบที่ไม่ได้สุ่มตัวอย่าง เพื่อรับข้อมูลที่สมบูรณ์สำหรับการรายงานการตลาดและประมาณการประสิทธิภาพการโฆษณาอย่างถูกต้อง ในบทความนี้ เราจะสำรวจว่าคุณสามารถรวบรวมข้อมูลดิบได้อย่างไรและจะจัดเก็บไว้ที่ใด
สารบัญ
- ทำไมคุณต้องรวบรวมข้อมูลดิบที่ไม่ได้สุ่มตัวอย่าง
- สี่วิธีในการรวบรวมข้อมูลดิบ
- ท่อส่ง OWOX BI
- ใช้ Google Analytics API
- การส่งออก BigQuery สำหรับ Google Analytics 360
- สร้างตัวเชื่อมต่อของคุณเอง
- จะจัดเก็บข้อมูลที่รวบรวมไว้ที่ไหน
- ทำไมต้องเป็น Google BigQuery
- บทสรุปสั้นๆ
ค้นหามูลค่าที่แท้จริงของแคมเปญ
นำเข้าข้อมูลค่าใช้จ่ายไปยัง Google Analytics โดยอัตโนมัติจากบริการโฆษณาทั้งหมดของคุณ เปรียบเทียบต้นทุนแคมเปญ CPC และ ROAS ในรายงานเดียว

ทำไมคุณต้องรวบรวมข้อมูลดิบที่ไม่ได้สุ่มตัวอย่าง
Google Analytics เป็นผู้นำที่ไม่มีข้อโต้แย้งในบริการวิเคราะห์เว็บ ใช้งานได้ฟรี ใช้งานง่าย และให้ข้อมูลเชิงลึกเกี่ยวกับ KPI หลักของธุรกิจออนไลน์ อย่างไรก็ตาม มีข้อจำกัดในระบบที่ป้องกันไม่ให้คุณเจาะลึกข้อมูลและสำรวจข้อมูลจากทุกด้าน
- ข้อมูลที่คุณเห็นในรายงาน Google Analytics จะถูกรวบรวมไว้เสมอ และกระบวนการนี้อยู่เหนือการควบคุม
- การสุ่มตัวอย่าง ซึ่งสามารถบิดเบือนข้อมูลของคุณอย่างจริงจังและนำไปสู่การตัดสินใจทางธุรกิจที่ผิดพลาด
- รายงานสามารถมีจำนวนจำกัดและเฉพาะชุดค่าผสมของพารามิเตอร์และตัวเลขหลักเท่านั้น
- จำกัดจำนวนบรรทัด
- เวลาในการประมวลผลข้อมูล — หากคุณใช้ Google Analytics เวอร์ชันฟรี คุณต้องรอ 24-48 ชั่วโมงเพื่อให้ระบบประมวลผลข้อมูลเสร็จสิ้น
โชคดีที่ปัญหาเหล่านี้ส่วนใหญ่สามารถแก้ไขได้ด้วยข้อมูลดิบ เจ๋งมากใช่มั้ย? มาดูวิธีการรับข้อมูลดิบกัน
สี่วิธีในการรวบรวมข้อมูลดิบ
ท่อส่ง OWOX BI
ตั้งค่าการรวบรวมข้อมูลดิบโดยอัตโนมัติผ่าน OWOX BI Pipeline — Hit ทั้งหมดที่ส่งจากเว็บไซต์ของคุณไปยัง Google Analytics จะถูกส่งไปยัง Google BigQuery ควบคู่กัน ด้วยเหตุนี้ แต่ละ Hit จะพร้อมใช้งานใน GBQ ในเวลาไม่กี่นาที

ตารางที่มีข้อมูลเซสชันสร้างขึ้นตามอัลกอริทึม OWOX BI — กระบวนการนี้มีรายละเอียดอธิบายไว้ในศูนย์ช่วยเหลือของเรา ในเวลาเดียวกัน OWOX BI ใช้โครงสร้างข้อมูลที่เข้ากันได้กับโครงสร้าง GA โดยมีตัวอย่างการสืบค้น SQL จำนวนมากถูกเขียนขึ้น ซึ่งจะช่วยประหยัดเวลาในการเตรียมรายงานของทีม
การรวบรวมข้อมูล Hit ดิบด้วย OWOX BI ให้ประโยชน์เหล่านี้แก่คุณ:
- ข้อมูลพฤติกรรมของผู้ใช้จะโอนไปยัง Google BigQuery แบบเรียลไทม์และไม่จำกัดจำนวน Hit
- ใน Google Analytics จำนวนพารามิเตอร์ผู้ใช้ถูกจำกัด: 20 ในเวอร์ชันมาตรฐานและ 200 ในเวอร์ชันที่ต้องชำระเงิน แต่ใน GBQ คุณสามารถรวบรวมพารามิเตอร์ที่กำหนดเองได้มากเท่าที่คุณต้องการ และสร้างรายงานเชิงลึกสำหรับการวิเคราะห์โดยละเอียด
- คุณสามารถสร้างรายงานใน GBQ โดยไม่ต้องสุ่มตัวอย่างและข้อจำกัดเกี่ยวกับจำนวนและความเข้ากันได้ของพารามิเตอร์และมิติข้อมูล ในช่วงเวลาใดก็ได้
- ต่างจาก Google Analytics ใน BigQuery คุณสามารถรวบรวมและใช้ข้อมูลส่วนบุคคลของลูกค้า ซึ่งรวมถึงที่อยู่อีเมลและหมายเลขโทรศัพท์
- OWOX BI คำนวณมูลค่าของแต่ละเซสชัน ด้วยเหตุนี้ คุณจึงสามารถคำนวณ ROI/ROAS สำหรับผู้ใช้ใหม่และผู้ใช้ที่กลับมา และคุณสามารถประเมินประสิทธิภาพของการโฆษณาในภูมิภาค กลุ่มผลิตภัณฑ์ หน้า Landing Page เวอร์ชันมือถือ และแอปพลิเคชันต่างๆ ได้
- บริการนี้อนุญาตให้คุณอัปเดตข้อมูลย้อนหลังเกี่ยวกับต้นทุน ผู้ใช้ และธุรกรรมที่อัปโหลดไปยัง GBQ แล้ว คุณสามารถพิจารณาคำสั่งซื้อ การคืนสินค้าหลังการซื้อ หรือตัวอย่างเช่น ค้นหาว่าผู้สมัครสมาชิกรายใหม่กำลังทำอะไรบนเว็บไซต์ของคุณ 30 วันก่อนการลงทะเบียน
- ทุกวัน OWOX BI จะเปรียบเทียบข้อมูลใน BigQuery ของคุณกับข้อมูลจาก GA และรายงานความคลาดเคลื่อนที่มีนัยสำคัญ คุณจะไม่สูญเสียข้อมูลสำคัญที่เครื่องมือติดตามบุคคลที่สามไม่สามารถให้ได้
อ่านเพิ่มเติมเกี่ยวกับประโยชน์ทั้งหมดของการรวบรวมข้อมูล OWOX BI:
วิธีตั้งค่าการรวบรวมข้อมูลดิบจากเว็บไซต์ใน Google BigQuery โดยใช้ OWOX BI:
- ใช้บัญชี Google ของคุณเพื่อลงชื่อเข้าใช้
- เลือกข้อมูลที่คุณต้องการรวบรวมใน GBQ ให้การเข้าถึง และสร้างไปป์ไลน์ข้อมูล
- คัดลอกโค้ดติดตามและโพสต์บนเว็บไซต์ในลักษณะที่สะดวกสำหรับคุณ
คุณดาวน์โหลดคำแนะนำโดยละเอียดเกี่ยวกับวิธีตั้งค่าการอัปโหลดข้อมูลดิบจากเว็บไซต์ไปยัง BigQuery ได้


คำแนะนำเกี่ยวกับวิธีการส่งออกข้อมูลดิบจาก Google Analytics
ดาวน์โหลดใช้ Google Analytics API
Google Analytics ให้คุณดึงข้อมูลโดยใช้ API โดยเฉพาะอย่างยิ่ง Core Reporting API ช่วยให้คุณเข้าถึงมิติข้อมูลและเมตริกสำหรับมุมมองการรายงานที่คุณเลือกจากภายนอกอินเทอร์เฟซ GA
นอกจากนี้ยังมีวิธีแก้ปัญหาที่จะช่วยให้คุณเข้าถึงข้อมูลสำหรับแต่ละ Hit และอำนวยความสะดวกในการรวมข้อมูลได้ ซึ่งสามารถทำได้โดยใช้ฟังก์ชัน API ร่วมกับมิติข้อมูลที่กำหนดเองใน Google Analytics
มิติข้อมูลที่กำหนดเองสามารถใช้เพื่อบันทึก วิเคราะห์ และแสดงภาพข้อมูลที่ไม่ได้แสดงใน Google Analytics โดยค่าเริ่มต้น คุณสามารถใช้มิติข้อมูลที่กำหนดเองเป็นกุญแจสำคัญในการรวมข้อมูลจาก GA และระบบอื่นๆ ตลอดจนปรับปรุงรายงานของคุณด้วยข้อมูลที่เกี่ยวข้องกับธุรกิจของคุณ ตัวอย่างเช่น คุณสามารถบันทึก ID ผู้ใช้จากฐานข้อมูลของคุณ และใช้สำหรับการรวมการดำเนินการออฟไลน์และออนไลน์
ตัวอย่างของมิติข้อมูลที่กำหนดเอง:
- Hit timestamp — มิติข้อมูลที่กำหนดเองในขอบเขต Hit ที่บันทึกการประทับเวลาที่แน่นอนเมื่อ Hit เกิดขึ้น ในรูปแบบ yyyy-mm-ddThh: mm: ss พร้อมการชดเชยเขตเวลา
- รหัส เซสชัน — มิติข้อมูลที่กำหนดเองตามขอบเขตเซสชันที่รวบรวมค่าสุ่มที่ไม่ซ้ำกัน ใช้เพื่อระบุ Hit ที่อยู่ในเซสชันเดียวกัน
- รหัสไคลเอ็นต์ — มิติข้อมูลที่กำหนดเองในขอบเขตเซสชันที่รวบรวมค่าที่ไม่ซ้ำกันซึ่งกำหนดให้กับอุปกรณ์ของลูกค้าจากคุกกี้ _ga
- User ID — มิติข้อมูลที่กำหนดเองตามขอบเขต Hit ที่รวบรวมค่าที่แสดงถึงผู้ใช้ที่ลงชื่อเข้าใช้เว็บไซต์ของคุณ ช่วยให้คุณระบุเซสชันและ Hit ทั้งหมดของผู้ใช้รายนี้

เครดิตสำหรับรายการตัวอย่างนี้ไปที่ Simo Ahava สำหรับโพสต์ที่ยอดเยี่ยมของเขาเกี่ยวกับการปรับปรุงการรวบรวมข้อมูลด้วยมิติข้อมูลที่กำหนดเองและ Google Tag Manager
เหตุใด API จึงไม่ใช่โซลูชันที่สมบูรณ์แบบ
Google Analytics API จะแก้ปัญหาการสุ่มตัวอย่างหรือไม่ ขึ้นอยู่กับปริมาณการเข้าชมเว็บไซต์ของคุณ หากการเข้าชมไม่สูงเกินไป และคุณเลือกระยะเวลาการรายงานที่สั้น คุณสามารถหลีกเลี่ยงการสุ่มตัวอย่างได้ ในทางกลับกัน คุณจะต้องเรียกใช้การสืบค้นหลายร้อยครั้งเพื่อรับข้อมูลที่ไม่ได้สุ่มตัวอย่าง
เนื่องจากข้อมูลจะถูกส่งออกจาก Google Analytics เงื่อนไขการประมวลผลข้อมูลของ GA ทั้งหมด รวมถึงความเข้ากันได้ของมิติข้อมูลและเมตริก และเวลาในการประมวลผลข้อมูลจะมีผลบังคับใช้ด้วย แต่สำหรับสตาร์ทอัพและโครงการขนาดเล็ก API อาจทำงานเป็นโซลูชันชั่วคราว Simo Ahava มีโพสต์ที่ยอดเยี่ยมในบล็อกของเขา ซึ่งเขาได้สำรวจสิ่งที่ถือได้ว่าเป็นข้อบกพร่องของสคีมาข้อมูล Google Analytics
นอกจากนี้ยังมีขีดจำกัดและโควต้าเฉพาะสำหรับ Google Analytics API เช่น จำนวนมิติข้อมูลและเมตริกในข้อความค้นหา และจำนวนข้อมูลที่คุณสามารถดึงออกมาได้ต่อวัน
นอกจากนี้ คุณจะต้องมีเนื้อที่สำหรับจัดเก็บข้อมูลที่ส่งออก สิ่งนี้นำเราไปสู่แนวทางที่ซับซ้อนยิ่งขึ้นซึ่งจะพิสูจน์ว่าได้เปรียบสำหรับธุรกิจของคุณอย่างแน่นอน
การส่งออก BigQuery สำหรับ Google Analytics 360
Google Analytics 360 ไม่ใช่เครื่องมือราคาถูก แต่คุณจะได้ในสิ่งที่คุณจ่ายไป และอื่นๆ อีกมากมาย นอกเหนือจากการได้รับประโยชน์จากคุณลักษณะขั้นสูงของแพลตฟอร์มแบบชำระเงินแล้ว ผู้ใช้ Google Analytics 360 ยังสามารถส่งออกข้อมูลดิบระดับ Hit และระดับเซสชันจาก Google Analytics ไปยัง Google BigQuery ผ่านการผสานรวมแบบเนทีฟ
มีสองตัวเลือกการส่งออกที่คุณสามารถเลือกได้ระหว่าง:
- ข้อมูลส่งออกอย่างต่อเนื่อง ด้วยตัวเลือกนี้ ในแต่ละวัน คุณจะได้รับไฟล์หนึ่งไฟล์ที่ส่งออกพร้อมกับข้อมูล Google Analytics ของวันก่อนหน้า และไฟล์อื่นๆ อีก 3 ไฟล์ที่ส่งออกพร้อมข้อมูลสำหรับวันปัจจุบัน ข้อมูลจากบริการที่เชื่อมโยงของ Google ก็มีให้เช่นกัน
- ส่งออกข้อมูลอย่างต่อเนื่อง ตัวเลือกนี้ช่วยให้คุณรับข้อมูลที่ใหม่กว่าด้วยการส่งออกไปยัง Google BigQuery ทุกๆ 10 ถึง 15 นาที ในกรณีนี้ Google BigQuery จะเรียกเก็บเงินเพิ่มเติม $0.05 สำหรับข้อมูลที่ประมวลผลแต่ละกิกะไบต์ โปรดทราบว่าข้อมูลจากบริการที่เชื่อมโยงกับ Google Analytics เช่น DoubleClick for Publishers, AdSense และ AdX สามารถส่งออกได้ทุกวันเท่านั้นในวันก่อนหน้า
เมื่อคุณเชื่อมโยงข้อมูลพร็อพเพอร์ตี้ Google Analytics กับ Google BigQuery ในตอนแรก Google Analytics 360 จะส่งออกข้อมูลประวัติการเข้าชม 10 พันล้านครั้งหรือ 13 เดือนไปยัง BigQuery โดยอัตโนมัติ นั่นไม่ใช่เรื่องใหญ่สำหรับผู้ที่มีปัญหากับการสุ่มตัวอย่างตลอดเวลาหรือไม่?
และนี่คือจุดสุดยอด: ผู้ใช้ Google Analytics 360 ได้รับเครดิต $500 ต่อเดือนเพื่อครอบคลุมค่าใช้จ่ายในการนำเข้า จัดเก็บ และประมวลผลข้อมูลใน Google BigQuery
สร้างตัวเชื่อมต่อของคุณเอง
คุณสามารถโคลน Hit ที่คุณส่งไปยัง Google Analytics และประมวลผลข้อมูลที่คัดลอกมาจากที่อื่นนอก GA สำหรับสิ่งนี้ คุณสามารถลองจัดเก็บ Hit บนเซิร์ฟเวอร์ของคุณเองหรือใช้โซลูชันบนคลาวด์ ข้อมูลที่มีขอบเขตการเข้าถึงเพียงอย่างเดียวจะไม่ให้ข้อมูลแหล่งที่มา สื่อ หรือแคมเปญ และจะไม่ให้ข้อมูลต้นทุนโฆษณาหรือสถานที่ตั้งแก่คุณ อย่างไรก็ตาม วิธีนี้จะช่วยให้คุณได้รับ Hit ดิบทันทีที่ส่งจากเว็บไซต์ของคุณและใช้เพื่อวัตถุประสงค์ที่ไม่ต้องการข้อมูลระดับเซสชัน เช่น การส่งอีเมลธุรกรรมที่ตรงเวลาและระบุปัญหาเกี่ยวกับประสิทธิภาพของเว็บไซต์
หากคุณไม่ต้องการใช้เวลาและเงินในการออกแบบตัวเชื่อมต่อของคุณเอง ทีมนักวิเคราะห์ OWOX BI สามารถช่วยคุณได้ ลงทะเบียนสำหรับการสาธิตเพื่อขอประชุมและดูรายละเอียดว่า OWOX สามารถตอบสนองความต้องการทางธุรกิจของคุณได้อย่างไร
จะจัดเก็บข้อมูลที่รวบรวมไว้ที่ไหน
ไม่ว่าคุณจะเป็นสตาร์ทอัพขนาดเล็กหรือองค์กรขนาดใหญ่ มีหลายปัจจัยที่ควรพิจารณาเมื่อเลือกระบบจัดเก็บข้อมูล ไม่ว่าคุณจะเลือกตัวเลือกใด ต่อไปนี้คือภาพรวมคร่าวๆ ของสิ่งที่คุณควรมองหา:
- ความสามารถในการประมวลผลข้อมูล การรวบรวมข้อมูลดิบเป็นสิ่งที่ดีและทั้งหมด แต่หากคุณไม่สามารถประมวลผลและดึงข้อมูลที่ต้องการได้ ข้อมูลนี้จะไม่มีประโยชน์สำหรับคุณ
- ความสามารถในการปรับขนาดได้อย่างยืดหยุ่นตามความต้องการทางธุรกิจของคุณ เมื่อธุรกิจของคุณเติบโตขึ้น คุณต้องการให้คลังสินค้าของคุณปรับตัวตามนั้น
- มาตรฐานความปลอดภัย สูง คุณต้องมั่นใจว่าข้อมูลอันมีค่าของคุณได้รับการปกป้องและอยู่ภายใต้การควบคุมของคุณอย่างเต็มที่
- ค่าใช้จ่ายที่เหมาะสม
โชคดีสำหรับพวกเราทุกคน ไม่จำเป็นต้องสร้างวงล้อขึ้นมาใหม่ โดยเฉพาะอย่างยิ่งเมื่อมีบริการที่ดีอยู่แล้ว เช่น Google BigQuery ซึ่งเป็นคลังข้อมูลบน Google Cloud Platform ที่ออกแบบมาสำหรับการวิเคราะห์ข้อมูล
ทำไมต้องเป็น Google BigQuery
Google BigQuery อนุญาตให้จัดเก็บและประมวลผลแถวหลายพันล้านแถว (นั่นคือข้อมูลกิกะไบต์และเพตาไบต์) โดยใช้ไวยากรณ์ที่เหมือน SQL ความเร็วในการประมวลผลที่เหลือเชื่อ? ตรวจสอบ. ความสามารถในการขยายขนาด? ตรวจสอบ. ความปลอดภัยของข้อมูลที่ไม่มีใครเทียบ? ตรวจสอบ. บริการนี้มีทุกสิ่งที่คุณต้องการสำหรับการวิเคราะห์ขั้นสูงของข้อมูลจำนวนมาก
Google BigQuery เป็นบริการแบบชำระเงิน แต่คุณจะจ่ายเฉพาะปริมาณข้อมูลที่จัดเก็บและประมวลผลเท่านั้น ฟรี 10 กิกะไบต์แรกที่จัดเก็บและ 1 เทราไบต์ที่ประมวลผลต่อเดือน หลังจากนั้น Google จะเรียกเก็บเงิน $0.02 สำหรับแต่ละกิกะไบต์ที่จัดเก็บ และ $5 สำหรับการประมวลผลแต่ละเทราไบต์ ตามข้อกำหนดในการให้บริการในขณะที่เขียน ผู้ใช้ BigQuery ใหม่ยังได้รับเครดิต $300 เพื่อใช้จ่ายในช่วง 12 เดือน
เหตุใด Google BigQuery จึงไม่ใช่โซลูชันที่สมบูรณ์แบบ
หากคุณเพิ่งเริ่มใช้ GBQ ใหม่ทั้งหมด คุณอาจต้องทบทวนถึงวิธีการจัดระเบียบข้อมูลในบริการนี้
ก่อนอื่น จำไว้ว่า GBQ รองรับฟิลด์ที่ซ้อนกันและซ้ำ เนื่องจากข้อมูล Google Analytics ถูกจัดเป็นโครงสร้างแบบลำดับชั้นของ Hit เซสชัน และผู้ใช้ คุณอาจต้องเรียนรู้วิธีสืบค้นข้อมูลเพื่อเข้าถึงค่าจากฟิลด์ที่ซ้อนกันและซ้ำกันเหล่านี้
ตรวจสอบการอ้างอิงที่สะดวกเหล่านี้สำหรับส่วนคำสั่ง JOIN และ FLATTEN: คุณอาจจำเป็นต้องใช้บ่อยๆ อีกสิ่งหนึ่งที่ควรคำนึงถึงเมื่อใช้ BigQuery คือระบบจะไม่คำนวณเมตริกบางตัวที่มีอยู่ในอินเทอร์เฟซของ Google Analytics โดยอัตโนมัติ เช่น ผู้ใช้ทั้งหมดและเหตุการณ์ทั้งหมด
บทสรุปสั้นๆ
การส่งออกข้อมูลดิบจาก Google Analytics ทำได้ง่ายกว่าที่เห็นในแวบแรก ไม่ว่าคุณจะตัดสินใจลงทุนในโซลูชันที่พร้อมใช้งานทันทีหรือสร้างโซลูชันของคุณเองนั้นขึ้นอยู่กับคุณ อย่าปล่อยให้ทรัพย์สินอันมหาศาลนี้ไร้ประโยชน์
ใช้ประโยชน์จากข้อมูลที่คุณรวบรวม มองหาข้อมูลเชิงลึกใหม่ๆ บูรณาการ การทดลอง. รู้จังหวะของเว็บไซต์ของคุณ และเชื่อมต่อกับลูกค้าเมื่อพวกเขาต้องการคุณมากที่สุด และจำไว้ว่าคุณสามารถถามคำถามได้เสมอในส่วนความคิดเห็นด้านล่าง เรายินดีที่จะตอบกลับ!
และหากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Google Analytics และเครื่องมือวิเคราะห์อื่นๆ โปรดสมัครรับจดหมายข่าวของเรา ทุกเดือน คุณจะได้รับคำแนะนำที่เป็นประโยชน์สำหรับนักการตลาดและนักวิเคราะห์ยุคใหม่