GoogleAnalyticsから生データをエクスポートする方法
公開: 2022-04-12サンプリングされていない生データを収集する必要があるのはなぜですか? マーケティングレポートの完全なデータを取得し、広告効率を正しく見積もる。 この記事では、生データを収集する方法とその保存場所について説明します。
目次
- 生の非サンプリングデータを収集する必要がある理由
- 生データを収集する4つの方法
- OWOXBIパイプライン
- GoogleAnalyticsAPIを使用する
- GoogleAnalytics360のBigQueryエクスポート
- 独自のコネクタを作成する
- 収集したデータを保存する場所
- なぜGoogleBigQueryなのか?
- 短い結論
キャンペーンの真の価値を知る
すべての広告サービスからGoogleアナリティクスに費用データを自動的にインポートします。 キャンペーンの費用、CPC、ROASを1つのレポートで比較します。

生の非サンプリングデータを収集する必要がある理由
Google Analyticsは、Web分析サービスの中でも誰もが認めるリーダーです。 無料で操作が簡単で、オンラインビジネスの主要なKPIに関する洞察を提供します。 ただし、システムには制限があり、データを深く掘り下げて、あらゆる側面からデータを探索することはできません。
- Google Analyticsレポートに表示されるデータは常に集計されており、このプロセスは制御できません。
- サンプリング。データをひどく歪め、誤ったビジネス上の決定につながる可能性があります。
- レポートには、限られた数のパラメータとキー数値の特定の組み合わせのみを含めることができます。
- 行数を制限します。
- データ処理時間—無料バージョンのGoogle Analyticsを使用する場合、システムがデータ処理を完了するまで最大24〜48時間待つ必要があります。
幸い、これらの問題のほとんどは生データで解決できます。 かなりかっこいいですね生データを取得する方法を考えてみましょう。
生データを収集する4つの方法
OWOXBIパイプライン
OWOX BIパイプラインを介して自動生データ収集を設定します—ウェブサイトからGoogleアナリティクスに送信されるすべてのヒットは、並行してGoogleBigQueryに送信されます。 このおかげで、各ヒットは数分でGBQで利用可能になります。

セッションデータを含むテーブルは、OWOX BIアルゴリズムに従って作成されます。このプロセスについては、ヘルプセンターで詳しく説明されています。 同時に、OWOX BIはGA構造と互換性のあるデータ構造を使用し、その下にSQLクエリの多くの例が記述されています。 これにより、チームがレポートを準備する時間を節約できます。
OWOX BIを使用して生のヒットデータを収集すると、次のような利点があります。
- ユーザーの行動データは、ヒット数の制限なしにリアルタイムでGoogleBigQueryに転送されます。
- Google Analyticsでは、ユーザーパラメータの数が制限されています。標準バージョンでは20、有料バージョンでは200です。 ただし、GBQでは、必要な数のカスタムパラメータを収集し、詳細な分析のために詳細なレポートを作成できます。
- サンプリングを行わずに、パラメータとディメンションの数と互換性を制限することなく、任意の期間のレポートをGBQで作成できます。
- Google Analyticsとは異なり、BigQueryでは、メールアドレスや電話番号などの個人の顧客データを収集して使用できます。
- OWOX BIは、各セッションの値を計算します。 これにより、新規ユーザーとリピーターのROI/ROASを計算できます。 また、さまざまな地域、製品グループ、ランディングページ、モバイルバージョン、およびアプリケーションの広告の効果を評価できます。
- このサービスを使用すると、GBQにすでにアップロードされているコスト、ユーザー、およびトランザクションに関するデータを遡及的に更新できます。 購入した注文、購入後の返品を考慮に入れることができます。たとえば、登録の30日前に新しいサブスクライバーがWebサイトで何をしていたかを調べることができます。
- OWOX BIは、BigQueryのデータをGAの情報と毎日比較し、重大な不一致を報告します。 サードパーティのトラッカーが提供できない重要なデータを失うことはありません。
OWOX BIデータ収集のすべての利点についてもっと読む:
OWOX BIを使用してGoogleBigQueryのウェブサイトから生データ収集を設定する方法:
- Googleアカウントを使用してサインインします。
- GBQで収集するデータを選択し、アクセスを提供して、データパイプラインを作成します。
- トラッキングコードをコピーして、便利な方法でWebサイトに投稿してください。
ウェブサイトからBigQueryへの生データのアップロードを設定する方法の詳細な手順をダウンロードできます。


GoogleAnalyticsから生データをエクスポートする方法に関するガイド
ダウンロードGoogleAnalyticsAPIを使用する
Google Analyticsでは、APIを使用して情報を取得できます。 特に、Core Reporting APIを使用すると、GAインターフェースの外部から、選択したレポートビューのディメンションと指標にアクセスできます。
さらに、ヒットごとにデータにアクセスし、データ統合を容易にする回避策があります。 これは、API機能とGoogleアナリティクスのカスタムディメンションを使用して実現できます。
カスタムディメンションを使用して、デフォルトでGoogleアナリティクスに表示されない情報をキャプチャ、分析、および視覚化できます。 GAや他のシステムからの情報を組み合わせるためのキーとして、またビジネスに関連する情報でレポートを強化するためのキーとして、カスタムディメンションを使用できます。 たとえば、データベースからユーザーIDを保存し、それを使用してオフラインアクションとオンラインアクションを統合できます。
カスタム寸法の例:

- ヒットタイムスタンプ—ヒットが発生したときの正確なタイムスタンプをタイムゾーンオフセット付きのyyyy-mm-ddThh:mm:ss形式でキャプチャするヒットスコープのカスタムディメンション。
- セッションID—同じセッションに属するヒットを識別するために使用される、一意のランダムな値を収集するセッションスコープのカスタムディメンション。
- クライアントID —_gacookieからクライアントのデバイスに割り当てられた一意の値を収集するセッションスコープのカスタムディメンション。
- ユーザーID— Webサイトにログインしたユーザーを表す値を収集するヒットスコープのカスタムディメンション。これにより、この特定のユーザーのすべてのセッションとヒットを識別できます。
この例のリストの功績は、カスタムディメンションとGoogleタグマネージャーを使用したデータ収集の改善に関するすばらしい投稿をしてくれたSimoAhavaにあります。
APIが完璧なソリューションではないのはなぜですか?
Google Analytics APIはサンプリングの問題を解決しますか? それはあなたのウェブサイトがどれだけのトラフィックを得るかに依存します。 トラフィックがそれほど多くなく、短いレポート期間を選択した場合、サンプリングを回避できます。 一方、サンプリングされていないデータを取得するには、何百ものクエリを実行する必要があります。
情報はGoogleアナリティクスからエクスポートされるため、ディメンションと指標の互換性やデータ処理時間など、すべてのGAデータ処理条件も適用されます。 ただし、スタートアップや小規模なプロジェクトの場合、APIは一時的なソリューションとして機能する可能性があります。 Simo Ahavaは、彼のブログにすばらしい投稿をしており、GoogleAnalyticsデータスキーマの欠陥と見なすことができるものを探っています。
クエリ内のディメンションと指標の数、1日あたりに抽出できるデータの量など、GoogleアナリティクスAPIに固有の制限と割り当てもあります。
さらに、エクスポートされた情報を保存するためのスペースが必要になります。 これにより、より洗練されたアプローチが可能になり、ビジネスにとって確実に有利になります。
GoogleAnalytics360のBigQueryエクスポート
Google Analytics 360は安価なツールではありませんが、支払うものなどを手に入れることができます。 有料プラットフォームの高度な機能の恩恵を受けることに加えて、Google Analytics 360ユーザーは、ネイティブ統合を介して、生のヒットレベルおよびセッションレベルのデータをGoogleAnalyticsからGoogleBigQueryにエクスポートできます。
次の2つのエクスポートオプションから選択できます。
- データは継続的にエクスポートされます。 このオプションを使用すると、毎日1つのファイルが前日のGoogle Analyticsデータとともにエクスポートされ、他の3つのファイルが当日のデータとともにエクスポートされます。 リンクされたGoogleサービスからのデータも利用できます。
- データを継続的にエクスポートします。 このオプションを使用すると、10〜15分ごとにGoogleBigQueryにエクスポートしてより新しいデータを取得できます。 この場合、GoogleBigQueryは処理されたデータのギガバイトごとに追加の$0.05を請求します。 {DoubleClick for Publishers、AdSense、AdXなどのGoogle Analyticsにリンクされたサービスからのデータは、毎日、前日のエクスポートのみが可能であることに注意してください。
Googleアナリティクスビューを最初にGoogleBigQueryにリンクすると、Googleアナリティクス360は100億ヒットまたは13か月分の履歴データをBigQueryに自動的にエクスポートします。 ずっとサンプリングに苦労している人にとっては、それは大変なことではありませんか?
そして、これが一番の魅力です。GoogleAnalytics 360ユーザーは、Google BigQueryでのデータのインポート、保存、処理のコストをカバーするために、月額500ドルのクレジットを受け取ります。
独自のコネクタを作成する
または、Google Analyticsに送信するヒットのクローンを作成し、そのクローン情報をGAの外部で処理することもできます。 このために、ヒットを自分のサーバーに保存するか、クラウドベースのソリューションを使用してみることができます。 ヒットスコープのデータだけでは、ソース、メディア、キャンペーンのデータは得られません。また、広告費用や場所の情報も得られません。 ただし、このアプローチでは、ウェブサイトから送信されるとすぐに生のヒットを取得し、タイムリーなトランザクションメールの送信やウェブサイトのパフォーマンスの問題の特定など、セッションレベルのデータを必要としない目的で使用できます。
独自のコネクタの設計に時間とお金を費やしたくない場合は、OWOXBIアナリストのチームがお手伝いします。 デモにサインアップして会議をリクエストし、OWOXがビジネスニーズを満たす方法の詳細を確認してください。
収集したデータを保存する場所
あなたが小さなスタートアップであろうと大企業であろうと、データストレージシステムを選択する際に考慮すべき多くの要因があります。 どちらのオプションを選択した場合でも、探すべきものの概要は次のとおりです。
- データ処理機能。 生データを収集することはすべて良いことですが、それを処理して必要な情報を抽出できない場合、このデータは役に立ちません。
- ビジネス要件に基づいて柔軟に拡張する機能。 ビジネスが成長するにつれて、それに応じて倉庫を適応させる必要があります。
- 高セキュリティ基準。 貴重なデータが保護され、完全に管理されていることを確信する必要があります。
- リーズナブルなコスト。
私たち全員にとって幸運なことに、特にデータ分析用に設計されたGoogle CloudPlatformベースのデータウェアハウスであるGoogleBigQueryのような優れたサービスがすでに存在するため、車輪の再発明を行う必要はありません。
なぜGoogleBigQueryなのか?
Google BigQueryでは、SQLのような構文を使用して、数十億行(ギガバイトとペタバイトのデータ)を保存および処理できます。 信じられないほどの処理速度? 小切手。 スケーラビリティ? 小切手。 比類のないデータセキュリティ? 小切手。 このサービスは、膨大な量のデータの高度な分析に必要なすべてを提供します。
Google BigQueryは有料サービスですが、保存および処理されたデータの量に対してのみ料金を支払います。 1か月に保存された最初の10ギガバイトと処理された1テラバイトは無料です。 その後、Googleは保存されたギガバイトごとに0.02ドル、処理されたテラバイトごとに5ドルを請求します。 執筆時点の利用規約によると、BigQueryの新規ユーザーも12か月以上使用するために300ドルのクレジットを取得します。
Google BigQueryが完璧なソリューションではないのはなぜですか?
GBQをまったく使用したことがない場合は、このサービスで情報がどのように編成されているかについて頭を悩ませる必要があるかもしれません。
まず、GBQはネストされたフィールドと繰り返されるフィールドをサポートしていることに注意してください。 Google Analyticsデータはヒット、セッション、ユーザーの階層構造に編成されているため、これらのネストされた繰り返しフィールドの値にアクセスするためにデータをクエリする方法を学ぶ必要がある場合があります。
JOIN句とFLATTEN句については、これらの便利なリファレンスを確認してください。これらを頻繁に使用する必要がある場合があります。 BigQueryを使用する際に留意すべきもう一つの点は、ユーザーの総数やイベントの総数など、GoogleAnalyticsインターフェースで利用可能な一部の指標が自動的に計算されないことです。
短い結論
Google Analyticsからの生データのエクスポートは、一見したところよりも簡単です。 すぐに使用できるソリューションに投資するか、独自のソリューションを作成するかは、あなた次第です。 このすばらしい資産を未使用のままにしないでください。
収集したデータを活用します。 新しい洞察を探してください。 統合。 実験。 あなたのウェブサイトの脈動を知り、彼らがあなたを最も必要としているときに顧客とつながりましょう。 また、下のコメントセクションでいつでも質問できることを忘れないでください。 喜んで対応させていただきます!
また、Google Analyticsやその他の分析ツールについて詳しく知りたい場合は、ニュースレターを購読してください。 毎月、現代のマーケターやアナリストに役立つヒントを入手できます。