GAデータの混在が招いた目標設定ミスと、私が学んだ分析の現実
こんにちは、THE MOLTSのデータアナリストの梶井です。
「CVR改善で1,000CV増える!」と見積もったのに、実際は「全然増えないじゃん」
GAのデータ分析では、こんな話がよくあります。
数多くのCVR改善プロジェクトに携わるなかで、データの混在に気づけないと、目標設定から施策効果まで、すべてが狂ってしまうことを何度も経験してきました。
複数サイトのデータ、テスト環境のデータ、BtoBとBtoCユーザーの混在、SaaSのログインユーザーなど。実態と異なる数値をベースに戦略を立ててしまうケースは後を絶ちません。
今回は、よく見かける失敗パターンと対策を正直にお話しします。
データ混在が引き起こす典型的な失敗パターン
ケース1:「指名検索なのにCVRが低すぎる」— 混在の兆候を見落とすパターン
データ分析でよくあるのが、明らかにおかしな数値が出ているのに気づけないケースです。
GAのデータを見ていて「あれ?なんかおかしいな」と感じる瞬間があります。たとえば、指名検索なのにCVRが異常に低い場合や、Directのアクセス割合がやたら多い場合です。本来、指名検索はCVRが比較的高い流入経路ですし、DirectもブックマークやURLの直接入力などが主なため、通常はそこまで割合が多くなりません。
こういうときは、まず混在を疑います。
BtoBtoCサービスは特に要注意です。サーチコンソールを確認すると、法人向けコンテンツに個人ユーザーが大量流入していることがよくあります。
人材派遣会社の例では、「人材派遣とは?」という記事に「人材派遣 登録」で流入していました。明らかに個人の求職者が混じっているサインです。
こういった混在が起きていると、CVRの分析や施策効果の測定が意味をなさなくなります。
ケース2:「CVR1%改善で1,000CV増える!」— 簡単計算による目標設定ミス
分析現場でよく起こるのが、詳細分析前に数値を求められて、表面的な計算で見積もりを出してしまうケースです。
サイト全体のセッションとCV数は簡単に出せます。それをベースに見積もりを出すと、実態と大きく異なった数値が出てきます。
これはよく聞く話です。「セッション10万あるから、CVR1%改善すれば1,000CV増える!」と計算して報告し、蓋を開けてみたら全然増えていない。
後から調べると、ログインユーザーや個人ユーザーのノイズが大量に混じっていたというケースです。
本来、詳細分析なしに正確な目標数値は出せません。 でも、上からは「とりあえず数字出して」と言われる。現場としても困ってしまいます。
なので最近は、「これの目的は何ですか?」とまず確認するようにしています。目的がわからないまま数値を伝えると、その数値が独り歩きして、実態と異なるシミュレーションが出来上がってしまうからです。
ケース3:「途中参加のプロジェクト」— 複雑な環境での見落としパターン
プロジェクトの初期設計段階から関わっていない場合に起こりがちなのが、データ設定の前提を見落としてしまうケースです。
初期設計から参加していないと、混在に気づくのは本当に難しいです。途中アサインの案件では、結構見落とします。
さらに困るのが、複数ツールの併用です。GAだけでなく、ABテストツールやヒートマップツールなど、使うツールが増えるほど考慮漏れが発生しやすくなります。
設定工数がツール数だけ倍増するのも面倒ですが、一番の問題は工数増加によるミスや考慮漏れの発生です。
複数ツールを併用する場合は、設定やデータの前提条件を丁寧に確認することがより重要になります。
ケース4:「ABテストで結果が出ない」— 施策効果の誤判断パターン
混在データの影響で最も困るのが、施策効果を正しく判断できなくなるケースです。
印象的だったのは、ABテストを何度も繰り返していたのに、まったく結果が出なかったケースです。ノイズデータを見て仮説を立てていたので、見当違いのところに課題設定してしまっていました。
「A案の方がCVR良いじゃん!」と思っていたのに、実は混在データのせいで間違った判断をしていた。既存ユーザーのCVばかりが増えていて、新規獲得にまったく貢献していないなんてことも。
大失敗というほどではないですが、時間をかけてテストを繰り返していた分、「もっと早く気づけていれば」という後悔は大きかったです。
データの混在を防ぐ対策方法
こうした経験を踏まえて、私が実践している対策をご紹介します。
対策1. 目標設定は初期分析を前提に
事前に数値が欲しいと言われても、まず初期分析から提案することを基本にしています。
それでも数値が必要な場合は、簡単に条件を整理して出します。このとき「何目的ですか?」という確認は必須です。目的がわからないまま数値を伝えると、実態と異なるシミュレーションが出来上がってしまいます。
この確認をすることで、後から「これおかしくない?」と逆に聞かれるリスクも防げます。
対策2. SaaS系での除外設定
SaaS系の場合、ログインユーザーを除外する方法はいくつかあります。たとえば、ログインユーザーであることがわかるフラグを作成し、その情報をもとにデータをフィルタリングします。
このフラグに使える情報としては、以下のようなものがあります。
- ログインボタンのクリックイベント
- アカウント作成時に発行されるユーザーID
どちらの方法も、状況に応じて使い分けることで分析精度が劇的に向上します。
対策3. BtoBtoCでのユーザーラベリング
法人・個人両方向けのコンテンツもありますが、明確に分かれているコンテンツもあります。
そういったコンテンツを閲覧したユーザーには、法人・個人のラベルをつけて除外します。一手間かかりますが、分析精度が段違いに上がります。
たとえば、以下のような形でラベリングを行います。
- 法人向け資料ダウンロードページ閲覧者 → 「法人」ラベル
- 個人向け登録フォーム利用者 → 「個人」ラベル
対策4. 必須の内訳チェック
施策結果の判断ミスを防ぐには、全体数値だけでなく、なぜそうなっているのかを深掘りする習慣が重要です。
チャネル別、ランディングページ別など、簡単でもいいから内訳をチェック。これだけでも見落としが大幅に減ります。
とくに、以下の項目をチェックします。
- 流入チャネル別
- ランディングページ別
- 新規・リピーター別
- デバイス別
失敗を防ぐために大切にしていること
データ分析の失敗は、大きく目標設定のミスと施策結果の判断ミスに分けられます。
目標設定には、最初の段階での丁寧な分析が重要。施策結果については、表面的な数字だけでなく、必ず内訳を確認する習慣が欠かせません。
一番重要なのは「なんとなく」で進めないこと。 少しでも違和感を感じたら、必ず深掘りして原因を突き止める。GAのデータを普段見ない人では気づけないことが多いからこそ、私たち分析者がしっかりと見極める必要があります。
さいごに
GAのデータ混在は、多くの人が一度は経験する課題です。複数ツールの使用や複雑なサービス構造になると、どうしても見落としが生じやすくなります。
大切なのは、失敗を恐れずに、一つひとつのデータを丁寧に見ること。 少しでも「おかしいな」と感じたら、必ず立ち止まって原因を調べる習慣を身につけることです。
私自身、まだまだ気づけない混在があるかもしれません。それでも、これまでの経験を活かして、より正確な分析ができるよう心がけています。
同じような課題に悩んでいる方の参考になれば幸いです。
著者情報
SHO KAJII
Data Analyst
Web解析・改善ツールのマーケティングおよびデータ分析を経て、現在はデータアナリストとしてGoogleアナリティクスなどを活用し、CVR改善やUI/UX改善を支援。
記事をシェア