문제 없이 Google 애널리틱스 4용 보고서를 업그레이드하는 방법

게시 됨: 2023-03-16

Google 애널리틱스 유니버설(GAU) 사용자는 2023년 여름에 Google 애널리틱스 4(GA4)로 전환해야 합니다. 이것의 주요 문제는 데이터 모델 및 메트릭 계산 논리가 GAU와 비교하여 GA4에서 근본적으로 다르다는 것입니다. GA4로 전환한 후 이전 데이터의 일부는 GAU 구조에 보관되고 새 데이터는 GA4 구조에 저장됩니다. 이러한 이유로 기업은 전환 후 전년 대비(YoY) 지표를 평가하기 위해 진지한 노력을 기울여야 합니다(중간 수준의 데이터 분석가의 경우 최소 100시간 이상 작업).

분석가의 경우 이는 Google 애널리틱스 유니버설과 Google 애널리틱스 4 측정항목 간의 정렬을 달성하기 위해 매일 SQL 쿼리 페이지를 작성하고 정렬하는 데 소비한다는 것을 의미합니다. 하지만, 이 문제를 해결할 수 있는 방법이 있습니다! 분석가는 SQL 쿼리를 지속적으로 다시 작성하지 않고도 몇 분 만에 임시 보고서를 생성할 수 있으며 이 기사에서는 그 방법을 설명합니다.

보고서를 Google 애널리틱스 4 데이터 스키마로 업데이트하는 데 도움이 필요한 경우 OWOX BI 데모에 등록하세요. 귀하의 비즈니스와 관련된 방식으로 수행하는 가장 좋은 방법을 알려드리겠습니다.

데모 예약

목차

  • 보고서를 Google 애널리틱스 4로 업데이트할 때 발생하는 문제
  • OWOX BI를 사용하여 Google 애널리틱스 4 보고서 업데이트 속도를 높이고 단순화하는 방법
    • 데이터 모델이란?
    • 데이터 모델링이란
    • 데이터 모델링이 필요한 이유
    • OWOX BI가 데이터 모델링과 작동하는 방식
  • 데이터 모델링의 장단점
    • 장점
    • 단점
  • 주요 테이크 아웃

보고서를 Google 애널리틱스 4로 업데이트할 때 발생하는 문제

유니버설 애널리틱스는 2023년 7월 1일에 서비스가 중단되고 Google 애널리틱스 4로 대체됩니다. Google 애널리틱스 360(GA의 유료 버전) 고객의 경우 전환 기간이 2024년 7월 1일까지 연장되었습니다. 사용하는 GA 버전에 따라 보고서가 새 데이터 스키마로 업데이트되는 것은 시간 문제입니다.

이러한 전환에 비추어 분석가에게 가장 어려운 작업 중 하나는 Google 애널리틱스 유니버설 및 Google 애널리틱스 4의 데이터를 통합된 형식으로 제공하는 것입니다.

이 작업을 복잡하게 만드는 상황:

  • 측정항목 계산 논리는 GAU와 GA4 간에 크게 다릅니다. 특히 이러한 제품 버전은 기존 메트릭도 다르게 계산합니다. GAU 및 GA4의 모든 측정항목을 하나의 차트로 드래그하여 모든 것이 순조롭게 진행되기를 기대할 수는 없습니다.
  • Google BigQuery 데이터 스키마도 상당히 다릅니다. 유니버설 애널리틱스는 세션 기반 데이터 스키마를 적용하는 반면 Google 애널리틱스 4에는 이벤트 기반 데이터 스키마가 있습니다.
  • 대시보드에는 YoY 지표와 계절성 추세가 포함됩니다. 따라서 문제는 이러한 모든 메트릭이 포함된 대시보드를 계속 사용하는 방법입니다.

구체적인 예를 살펴보겠습니다. 이 대시보드가 ​​있다고 가정해 보겠습니다.

데이터 범위 비교가 포함된 대시보드
데이터 범위 비교가 포함된 대시보드

이 대시보드의 가장 중요한 부분은 현재 기간과 과거 기간에 대한 특정 메트릭의 비교를 나타내는 계절성 메트릭입니다. 과거 및 운영 데이터는 마케팅 대시보드에서 YoY 메트릭을 지원하기 위해 동일한 형식이어야 합니다.

이 경우 분석가의 과제는 N+ 레거시 SQL 쿼리를 업그레이드하여 마케팅 팀에 신뢰할 수 있는 보고서를 제공하는 것입니다. SQL 쿼리에 대한 사소한 수정으로도 영향을 받을 수 있는 모든 것을 테스트하고 디버그하기는 어렵습니다.

데이터 분석가는 1년 전에 생성된 SQL 쿼리를 아무 것도 손상시키지 않고 약간 수정할 계획입니다.
데이터 분석가는 1년 전에 생성된 SQL 쿼리를 아무 것도 손상시키지 않고 약간 수정할 계획입니다.

전환 위험도 고려해야 합니다. 보고서를 새 소스로 전송한 후(GAU에서 GA4로) 분석가는 데이터 스키마 및 메트릭 계산 논리의 근본적인 차이점을 설명하지 못할 수 있습니다. 예를 들어 세션은 다르게 형성됩니다. GA4에서는 첫 번째 사용자 소스만 고려되고 세션으로 이어지는 다른 모든 소스는 무시됩니다. 따라서 일부 트래픽 소스는 보고서에 표시되지 않습니다.

처음에는 이것이 눈에 띄지 않을 수 있습니다. 그러나 2~3분기에 부정확한 대시보드는 30% 이상의 예산 누수와 함께 비효율적인 광고 지출로 이어질 것입니다.

대시보드를 준비하고 만드는 것은 Jenga를 연상시킵니다. 보고서의 블록을 교체해야 할 때마다 분석가는 손가락을 꼬고 전체 구조가 무너지지 않기를 바랍니다.

OWOX에서는 Universal Analytics(또는 GA 360) 데이터 스키마에서 Google Analytics 4 데이터 스키마로 고객의 보고서를 전송하는 동안 이미 유사한 문제를 성공적으로 해결하고 있습니다. 이것이 우리가 솔루션과 일부 SQL 쿼리를 블로그 독자와 공유하고자 하는 이유입니다. 이 정보가 문제 없이 보고를 전송하는 데 도움이 되기를 바랍니다.

OWOX BI를 사용하여 Google 애널리틱스 4 보고서 업데이트 속도를 높이고 단순화하는 방법

보고서를 준비하는 우리의 접근 방식은(보고서가 작성된 비즈니스 영역에 관계없이) 모델링된 데이터가 아닌 원시 데이터를 기반으로 합니다.

데이터 모델이란?

데이터 모델은 데이터 엔터티, 해당 특성 및 엔터티 간의 관계를 설명합니다. 예를 들어 웹 사이트에서 사용자의 작업은 지정된 세션에 대해 병합되며 한 사용자가 세션에서 여러 온라인 전환을 수행할 수 있습니다.

액션, 사용자, 세션 및 온라인 전환의 4가지 개체와 세션과 액션 간의 일대다, 사용자와 온라인 전환 간의 일대다, 세션과 액션 간의 일대다 등 세 가지 연결이 있습니다. 온라인 전환.

데이터 모델은 현실 세계에 대한 우리의 인식을 반영하고우리의 데이터는 무엇에 관한 것입니까?어떻게 관련이 있습니까?데이터로 작업할 때 적용되는 조건 및 제한 사항은 무엇입니까?사람들이 서로를 명확하게 이해하려면 데이터 모델이 필요합니다.

데이터 모델링이란

데이터 모델링은 데이터를 데이터 모델의 요구 사항을 충족하는 형식으로 변환하는 프로세스입니다.

데이터 모델링이 필요한 이유

  • 다음을 통해 분석 작업의 가치와 효율성을 높입니다.
    • 보고서 구조 및 지표 계산 논리에 대한 변경 속도 향상
    • 보고서 및 대시보드 지원 비용 절감
    • 보고서 논의 및 승인 간소화
  • 다음을 통해 보고서의 데이터 품질을 높입니다.
    • 매개변수 및 메트릭 계산 논리를 구현할 때 중복 방지
    • 정확한 데이터의 소스인 하나의 데이터 계층 보유

데이터 모델은 개체 및 해당 계산 논리(모든 보고서에 유효함)를 설명하므로 수많은 도구를 대체하고 보고서의 논리를 설명합니다.

OWOX BI가 데이터 모델링과 작동하는 방식

OWOX BI는 원시 데이터를 분석 가능한 형식으로 변환하여 데이터 준비 시간을 절약합니다. 유니버설 애널리틱스와 Google 애널리틱스 4 데이터를 보고서에 원활하게 통합합니다.

다음은 Google 애널리틱스 데이터를 기반으로 구축된 데이터 모델의 예입니다.

표준 데이터 모델
표준 데이터 모델

보시다시피 세션, 트랜잭션, 페이지 및 장치를 비롯한 여러 개체가 있습니다.

여기서 가장 흥미롭고 중요한 점은 이러한 개체의 구조가 상호 연결되어 있지 않으며 데이터 소스와 관련이 없다는 것입니다. 라이브 데이터로 이러한 개체를 채우는 데 사용되는 소스(Matomo, Adobe, Google Analytics 등)는 중요하지 않습니다. 데이터 소스에 관계없이 모델은 데이터 모델이 비즈니스를 나타내는 것과 동일한 개체를 반환합니다. 작업하는 실제 개체 및 메트릭을 보여줍니다.

실제 세계에서 어떻게 보이는지 봅시다.

Universal Analytics에서 내보낸 세션이나 Google Analytics 4에서 내보낸 이벤트와 같은 원시 데이터 위에 SQL 쿼리를 작성하는 대신 모델링된 데이터를 만들 수 있습니다. 세션, 사용자 및 페이지 보기와 같은 실제 세계의 개체 및 엔터티를 나타내는 보편적이고 이해하기 쉬운 테이블입니다.

구체적인 예와 데이터 스키마를 살펴보겠습니다.

원시 데이터의 예는 다음과 같습니다. Google 애널리틱스 유니버설(왼쪽) 및 Google 애널리틱스 4(오른쪽)용 Google BigQuery의 데이터 스키마 스크린샷입니다.

Google 애널리틱스 유니버설 및 Google 애널리틱스 4용 Google BigQuery의 데이터 스키마

위에서 쓴 것처럼 데이터 스키마가 다릅니다. 이 데이터를 Google Data Studio 대시보드에 연결할 방법을 찾아야 합니다.

우리의 경험을 바탕으로 모델링된 테이블을 구축하는 것이 데이터 준비를 단순화하는 가장 좋은 방법입니다. 다음과 같이 표시됩니다.

위 데이터 모델의 개체 목록입니다. 객체 목록이 Google 애널리틱스 360과 Google 애널리틱스 4에서 동일한 것을 확인할 수 있습니다.

즉, 동일한 쿼리를 사용하여 대시보드 쿼리를 이 데이터와 연결할 수 있습니다. 이 쿼리의 구조는 동일합니다.

데이터 모델링의 장단점

원시 데이터 대신 모델링된 데이터에 대한 보고서 작성을 고려해야 하는 중요한 이유를 살펴보겠습니다.

데이터 모델링의 장단점

장점

1. 데이터는 과일과 같습니다. 혼합하기 전에 깨끗이 씻어야 합니다.분석가는 서로 다른 서비스 및 시스템에서 데이터를 수집합니다. 당연히 해당 데이터의 구조와 형식은 소스에 따라 다릅니다. 보고서를 작성하려면 서로 다른 소스의 데이터를 올바르게 병합해야 합니다. 커넥터 또는 다양한 ETL 서비스를 통해 업로드된 데이터 자체는 부정확하고(오류, 중복 및 불일치 포함) 통합 논리 및 구조가 부족합니다. 부정확하고 조각난 데이터는 정리하고 분석 가능한 형식으로 정규화해야 합니다.

OWOX BI를 사용하면 데이터를 수동으로 정리, 구조화 및 처리할 필요가 없습니다. 이 서비스는 원시 데이터를 분석 준비가 된 형식으로 자동으로 정규화합니다.

2. 각 보고서의 비즈니스 논리를 복사하고 다시 작성할 필요가 없습니다.예를 들어 다음을 수행할 필요가 없습니다.

  • 거래 중복 제거
  • 봇 및 내부 트래픽 필터링
  • 채널 그룹화 규칙 정의
  • 신규 및 복귀 사용자에 대한 기준 정의
  • UTM 매개변수 추적 수정

의심할 여지없이 모든 데이터 분석가는 마케터 로부터 다음과 같은 요청을 들었습니다. 이전 데이터를 기반으로 채널 그룹화 규칙을 조정하거나 개선하고 싶습니다. 또는 작동 방식이 아닌 신규 및 복귀 사용자에 대한 기준을 식별하고 싶습니다. Google 애널리틱스에서, 그러나 우리만의 방식으로 또는 지난 6개월 이내에 구매한 사용자만 반환하는 것으로 간주하고 싶습니다.

원시 데이터를 기반으로 보고서를 작성하는 경우 모든 데이터 변환 및 준비 활동은 보고서 수준에서 실행되어야 합니다. 즉, 비즈니스 논리를 모든 보고서에 복사하는 데 많은 시간을 소비해야 합니다.

모델링된 데이터에 대한 보고서를 작성하는 경우 비즈니스 논리를 복사할 필요가 없습니다. 모델링 단계에서 한 번 생성합니다.

3. 모델링된 데이터를 기반으로 보고서를 작성하면 임시 분석 속도가 빨라집니다.새로운 SQL 및 오케스트레이션 변환을 작성하는 시간을 절약하여 연간 분석을 활성화할 수 있습니다.

4. 데이터 모델링 덕분에 모든 보고서에 대해 신뢰할 수 있는 단일 소스를 생성할 수 있습니다.보고서에서 데이터 소스를 변경할 때 더 이상 문제가 있는 모든 쿼리를 해결할 필요가 없습니다. 세션, 트랜잭션 및 이벤트 데이터에 대해 이 소스를 사용할 수 있습니다.

5. 보고 계층을 단순화합니다.모델링된 데이터 위에 보고서를 작성하는 것은 중첩된 필드 및 레코드 필드를 처리하는 것보다 더 쉽고 일부 창 복잡한 함수 또는 JSON 추출 함수를 작성하는 것보다 쉽습니다.

단점

1. 모델링된 데이터는 하나 이상의 중간 계층입니다.조정하는 데 시간이 걸리며 모델링된 데이터를 모니터링하고 디버그해야 합니다.

2. 정규화를 위한 복잡한 JOIN.

3. 추가 데이터 처리.데이터를 모델 형식으로 변환하려면 데이터를 쿼리해야 합니다. 날짜에 파티션 테이블을 사용하는 것이 좋습니다. 날짜 차원을 기반으로 구축된 파티션 테이블을 사용하면 필요한 데이터만 업데이트할 수 있습니다. 거대한 테이블을 모두 다시 작성하고 Google BigQuery에서 처리된 모든 데이터와 기가바이트 또는 테라바이트 데이터에 대해 비용을 지불할 필요가 없습니다. 필요한 파티션을 업그레이드하고 업데이트할 수 있습니다. 이 접근 방식은 모든 데이터 테이블을 처리하는 것보다 경제적입니다.

이러한 단점을 처리하는 데 도움이 되도록 Google 애널리틱스 360 및 Google 애널리틱스 4 데이터를 모델링하기 위한 SQL 템플릿을 준비했습니다. 이 기사에서 제공하는 추가 자료를 다운로드하여 확인할 수 있습니다.

독자를 위한 보너스

Google 애널리틱스 360 및 Google 애널리틱스 4 스키마용 SQL 템플릿

지금 다운로드

주요 테이크 아웃

새 Google 애널리틱스 4 데이터 스키마로 보고서를 업데이트하는 것이 얼마나 쉬운가요? 모델링된 데이터를 사용합니다. 원시 데이터에 대한 보고서를 작성하는 대신 GA Universal 및 GA 4 스키마 위에 보편적이고 이해하기 쉬운 플랫 테이블을 작성할 수 있습니다.

이렇게 하면 데이터를 복사하고 정규화 논리를 수십 개의 SQL 쿼리에 삽입할 필요가 없습니다. 데이터 모델링 단계에서 한 번 하게 됩니다. 모든 프로젝트에 만병통치약은 아니지만 정기적으로 특별 보고서가 필요한 프로젝트에 최적의 방법입니다.

모델링된 테이블을 설정하고 오케스트레이션하려면 OWOX BI 데모에 등록하세요. 귀하의 데이터를 기반으로 프로젝트에서 유사한 테이블을 준비하는 방법에 대한 세부 정보를 기꺼이 공유하겠습니다.

데모 예약