GA(UA)の計測終了!今のうちにバックアップすべき過去データの選び方

GA(UA)の計測終了!今のうちにバックアップすべき過去データの選び方

これまで一般的に使われていたGAであるユニバーサルアナリティクス(以下UA)の計測が、2023年7月1日に終了します。データの閲覧は2024年7月1日までは保証されているため、それまでの間に過去データのバックアップを取る必要があります。

参考:アナリティクスヘルプ

しかし、バックアップにもコストがかかるうえに、「必要なデータ」を事前に定義しておかなければ、取得漏れが発生して後にうまく活用できなくなってしまう可能性があります

今回は、UAのバックアップ期限が過ぎた後に後悔することがないよう、データアナリストが指標やディメンションをどう選び、どのような手法でバックアップを取るのか、普段からクライアントにどのような提案をしているのかをまとめました。

4つの観点から「必要なデータ」を定義する

バックアップの際に必要になるデータは、当然ですが企業によって異なります。

全体像のみをおおまかに把握できればよいケースもあれば、過去にさかのぼって細かくデータを閲覧し、現在の数値と比較できる状態にしておいた方がよい場合もあるでしょう。

重要なのは、必要なデータを過不足なく、可視化できる状態で取得することだと考えています

バックアップを取り、将来的にそのデータを活用して意思決定を行うには、十分な粒度でデータを取っておく必要があります。しかし一方で、あらゆる指標を無暗に取得しても、コストがかかるばかりで活用されず、無駄が生じてしまうこともあるでしょう。

そこで、過不足なくUAデータをバックアップするために、まずは以下4つの観点から必要なデータを定義していきます。

01.普段どのようなレポートを見ているか

指標を選ぶ際は、「そのデータを取得したとして、本当に今後分析に活用するのか」という点を重視しています。

先にも述べた通り、無暗やたらに大量のデータを取得しても活用されないのであれば、コストがかかるだけで非効率的です。

そのため基本的には、今行っている施策や分析の内容をベースに、“今”必要となっている指標を選ぶのが望ましいと考えています。つまり、現在よく見ているレポートの指標や粒度を踏襲し、その内容をエクスポートしていきます。

02.どんな施策に取り組んでいるか

現在取り組んでいる施策をもとに、今後どのようなbefore/afterを見る可能性があるか、という観点からも考えていきます。

例えば、SEOの施策に取り組んでおり、過去と比べてどの程度数値が向上したのかを見る可能性があるのであれば、各ページと参照元(チャネル)の情報を掛け合わせた状態で、データを残しておく必要があるでしょう。

EFO(入力フォーム最適化)を行っているのであれば、フォームの入力ページから完了ページへの遷移率(入力完了率)を時系列に沿って出しておかなければ、A/Bテストの結果を後から正しく検証することが困難になってしまいます。

また、定期的にキャンペーンページを作成する企業であれば、そのページへのアクセス数や参照元情報(チャネル)・キャンペーンページ経由のコンバージョン数などを取得します。これらを残しておかないと、今後作るキャンペーンページと比較ができず、改善幅が把握しにくくなってしまいます。

03.どのように可視化したいか

データを取得し数字を出しただけでは、そこから気付きを得て仮説を立てたり、改善に活かしたりすることが難しいケースが多いです。そのため、取得したデータはグラフやチャートなど、何らかの形に可視化することを前提とします。

ただし、データの取得と可視化を別々に考えると、「足りない情報があり、うまくデータを統合できなかった」などと、後から取得漏れに気付くといったことが起こりがちです。

そのためバックアップする指標を選ぶ際は「どう分析するか」だけではなく、「どう可視化するのか」というところまで事前にイメージします

なお、UAのデータは、GA4の管理画面上でGA4のデータと統合して閲覧することができません。連続性を持たせて分析するには、両者のデータを1つの表やグラフにまとめて可視化する必要があります。

そのためにはどのような指標を取ればよいのか、そもそも本当に連続性を持たせて分析するのか、といったことを事前に考えておきます。

04.それらはコストをかけてまでダウンロードする必要があるか

「とにかく不安だからあらゆるデータをダウンロードしておきたい」という相談をいただくことも多いです。しかしそのような場合に私は「そのデータを取ったとして、本当に分析に活用するのか」を確認するようにしています。

今までもそのデータを振り返って分析していたのであればよいのですが、そうでないなら仮にバックアップを取ったとしても、今後も見る機会はほとんどないと考えられます。

バックアップを取り可視化するためのコストや、データの保管コストなどを考えると、これまで一切見ていなかった(そして今後も不要であろう)データをダウンロードする必要が本当にあるのかを、一度考え直すことも重要だと考えています。

データアナリストは指標やかけ合わせ項目をどう選ぶのか

私が普段クライアントのUAデータのバックアップを支援する際は、上記の前提のもと、クライアントへのヒアリングなどを行ったうえで、必要な指標やディメンションなどを選んでいきます。

ただし、指標やディメンションは数え切れないほど多くの種類があるため、取得漏れが発生しないように、以下のチェックシートを参照して取るべきデータを絞り込んでいきます。

このシートの通りに選んでエクスポートすれば、基本的には問題なくバックアップを取ることができるでしょう。

特定の情報に関するレポートを残したい時のチェックシート

Universal Analytics Data Export CheetSheet(Googleスプレッドシート)

このシートは、以下のように大きく5つの項目に分かれ「①特定の情報に関するレポートを残したい時に、②④どのようなディメンション(分析の切り口)と掛け合わせ、③⑤どういう指標を取るのか」をまとめた表です。

分析の切り口と指標をまとめた表

詳しくは後ほど解説しますが、ユニバーサルアナリティクスのカスタムレポートを利用してバックアップを取る際は①②③を参照し、Googleスプレッドシートアドオンでバックアップを取る際は①④⑤を参照します。

例えば普段から、ユーザーの使用デバイスや地域などに関するレポートを閲覧しており、それをカスタムレポートによって残したいのであれば、「ユーザー」という項目を見て(①)、その中でも必要なディメンションや指標(②③)を選択します。

②ディメンション(全て日別に)③指標

デバイス カテゴリ
ブラウザ(※)
ブラウザ バージョン(※)
オペレーティング システム(※)
OS のバージョン(※)

地域
市区町村
年齢
性別

(※)は必要に応じて

セッション
ページビュー数
ユーザー
新規ユーザー
直帰数
セッション時間
目標 ●● の完了数

選んだ過去データをどうバックアップするのか

ここまでで必要なデータを定義できたら、それらをどのようにバックアップするのかを考えます。

基本的にはデータの量や粒度などに応じて、以下3種類の手法を使い分けます。

  1. カスタムレポート
  2. Googleスプレッドシートアドオン
  3. バックアップツール

カスタムレポート

Googleアナリティクス(UA)の「カスタムレポート」という機能を使うことで、自社が取りたいデータをカスタマイズして集計し、レポートとして表示させることができます。

他の方法に比べて予備知識が不要で、おおまかなデータであれば短時間で簡単にバックアップすることができます

例えば前章のように「ユーザー」に関する情報を一通り残しておきたい場合は、以下のように設定します。

「ユーザー」に関する情報を一通り残したい場合の設定

※「指標」は前章の③の項目を参照し設定。「ディメンションの詳細」は前章の②「期間ディメンション」の項目を参照し設定。

特定の期間を設定すると、以下のような日付別のレポートが表示されます。

表示される日付別のレポート
※縦軸が期間ディメンション(日別)、横軸が指標

その後セカンダリディメンションという項目をクリックし、前章の②にあるディメンションを一つずつ設定していきます。

まず「デバイス カテゴリ」を選択すると、以下のようなレポートになりました。

分析の切り口を「デバイス カテゴリ」とした場合のレポート
※縦軸がディメンション(日別×デバイスカテゴリ別)、横軸が指標

取得したい期間やディメンションが設定できたら、画面上部から「エクスポート」ボタンを押します。すると以下のように、デバイスカテゴリ別で各指標のデータをバックアップすることができました。

デバイスカテゴリ別で各指標のデータをエクスポートした例

前章で選んだディメンションをカスタムレポートの「セカンダリディメンション」に一つずつ設定し、エクスポートを繰り返すことで、ユーザーに関するデータのバックアップを行えます。

ただしこの方法では、大まかな指標やディメンションのデータしか取得できず、また複数種類のレポートを作成するのに手間がかかってしまいます。そのため基本的にはデータ量が少なく、全体感だけ取っておきたい場合に使用するのが良いでしょう

また、カスタムレポートは同時にかけ合わせ可能なディメンションが5つまでという制約があります(後述の方式の場合は9つまで可能です)。かけ合わせの条件によっては、カスタムレポートではデータが抽出できない可能性があるので、あくまでもライトにデータ取得をする場合として割り切って利用します。

Googleスプレッドシートアドオン

指標やディメンション(分析の切り口)の掛け合わせが複雑になってくると、カスタムレポートでは対応しきれないケースが出てきます。

また、残しておきたいレポートの種類(コンバージョンのレポートとeコマースのレポートと……など)が多くなると、それら全てについて得たい指標とディメンションを掛け合わせてカスタムレポートを作成するのは、工数がかかりすぎてしまい現実的ではありません。

そのような場合は「Google Analytics」というスプレッドシートアドオンを使用して、Googleスプレッドシート上に自動でレポートを作成していきます。

レポートの作成方法については、以下の記事を参考にしてみてください。

参考記事:自動化でラクラク!Googleスプレッドシートアドオン+Google Analyticsで作るレポート作成方法 | デジタルマーケティングブログ

前章の例をもとにユーザーに関するレポートをバックアップする場合、Metricsには⑤の内容を、Dimensionsには④を参照して、以下のように入力します(ディメンションは合計9個までなので、各社で必要なものを取捨選択する必要があります)。

スプレッドシートアドオンの設定例

すると、このようなレポートを出力することができます。

スプレッドシートアドオンを使用したレポートの出力例

バックアップツール

UAデータのバックアップを取る際、一点だけ注意しなければいけないことがあります。それは、データ量が膨大になると、取得時にサンプリングという処理が行われることがあるという点です

サンプリングとは、該当する全てのデータから一部のみを抽出し、それをもとにレポートを表示させる機能です。例えば「全データの40%の情報をもとに、それを2.5倍したレポートを表示させる」といった処理のことを指します。

Googleアナリティクスではデータの出力を高速化するために、扱うデータ量が大きくなると、このサンプリングが自動でかかる仕様になっています。

当然ですが、サンプリングがかかったデータは実際の数値と異なるため、場合によっては分析に正しく活用できないことがあります。

これを避けるためには、膨大なデータをまとめて取得するのではなく、1日ごとのデータを複数回に分けてエクスポートできるツールを使う必要があります

その際に使用したいのが、「trocco」「Analytics Backup by QA」という2種類のツールです。

「trocco」は、細かい粒度でデータをカスタマイズして取得したい場合に活用します。取得したデータは、基本的にはBigQueryを用いて保管する必要があります。

一方の「Analytics Backup by QA」は、バックアップするデータを細かく設定しなくとも、1クリックで大量のビューを汎用的に取得し、専用のビュー画面で自由に閲覧することができます。

▼担当者よりコメントをいただきました
trocco®は、ETL/データ転送・データマート生成・ジョブ管理・データガバナンスなどのデータエンジニアリング領域をカバーした、分析基盤構築・運用の支援SaaSです。UA(旧GA)のデータはもちろん、あらゆる社内データの連携・整備・運用を自動化。データ活用の前準備にかかる工数を大幅に削減します。
▼担当者よりコメントをいただきました
Analytics Backup by QAは、買い切り2万円~のUA自動バックアップに特化したソフトウェアです。1クリックでデータを保存することができ、グラフが表示できる・表形式でも閲覧可能・任意の期間選択ができる・CSVデータが落とせるといった特徴があります。大手様から中小企業様まで幅広い導入実績があり、手作業でエクスポートしたけど少し不安、データ消失後に対応漏れを指摘されても困る、という方はぜひご検討ください。

落としたデータを可視化するまでが「バックアップ」と考える

UAに限った話ではありませんが、アクセス解析ツールを乗り換える際に、過去データをExcel等でバックアップして表データを残したは良いものの、それを後から振り返って活用しなくなってしまうケースを多く見てきました。

そのため、UAのデータを落とすだけではなく、それらを可視化をするところまでが「バックアップを取る」ということだと考えています

UAデータは2024年7月1日以降、バックアップを取ることすらもできなくなってしまう可能性があるため、その前に、可視化して得たい情報を漏れなく見ることができるかを確認しておくことも重要です。「データを落としたは良いものの、グラフ化してみたら項目が不足していた」といったことに、後から気付くケースも多いからです。

簡単なデータであれば、ExcelやGoogleスプレッドシートを用いて簡易集計・グラフ化を行う程度でも良いでしょう。

一方で複雑なデータであれば、Looker StudioなどのBIツールを使用して集計します。

特にGA4での計測を開始する以前のデータをUAデータと繋げて分析したい場合には、両者のデータを1つの表・グラフとして可視化し、連続性をもって分析できるようにする必要があります。

データを残すこと自体に価値があるわけではない

「とにかくバックアップを行いたい」というご相談をいただいた際は、一度立ち止まって、あらためて「本当にバックアップを取る必要があるのか」「必要ならどの指標をどのように可視化する必要があるのか」を考える機会を作っていただくことも多いです。

これまでの繰り返しになりますが、データを取得するのにもコストがかかりますし、活用を前提として適切に可視化できる状態を作るために、専門知識の学習が必要になることもあるでしょう。

私は、データを残すことそれ自体は、そこまで重要だとは思っていません。

将来的に過去を振り返って分析し、施策の改善や事業成長のために活用して初めて、データはその価値を発揮すると考えています

そして、ユニバーサルアナリティクス(UA)のデータの移行やGA4の導入・運用についてお困りの方がいらっしゃいましたら、ぜひ私たちMOLTSへご相談ください。

著者情報

MASAHIRO NISHI

西 正広

Marketing Strategist / Data Analyst

業界歴15年。データ戦略の立案、アクセス解析、CVR改善、データ活用基盤の構築などを担当。電通デジタルを経て2019年MOLTS参画。

担当領域の
サービス

  • マーケティングリサーチ
  • コミュニケーションプランニング
  • SEO
  • アクセス解析
  • CDP/DMP構築・運用

記事をシェア

  1. THE MOLTS
  2. メディア記事
  3. GA(UA)の計測終了!今のうちにバックアップすべき過去データの選び方