その数値って異常?~サイトのトレンドを見るときの注意点とポイント~
webサイトのトレンド把握や異常値検出のためのモニタリングレポートでは、月別や週別等の推移を見て施策の効果や異常値の検出等を行います。
しかし、単純に数値の増減という事実を追いかけてしまうと誤った判断を下してしまう可能性が高くなります。今回は、トレンドデータを正しく読み取り誤った判断を行わないための注意点と異常値検出のポイントをご紹介させて頂きたいと思います。
トレンドデータの注意点
1.トレンドデータの落とし穴
上記のグラフを、学生をターゲットとしたサイトのページビュー数の月別の推移と仮定します。
この場合、一番目につくのは2月のページビュー数の下落幅が大きいことでしょう。このようなグラフを見た場合、「2月に何か異常があったのではないか。」と考えてしまいがちですが、いきなり異常値と判断するには早過ぎます。異常値と判断する前に考慮すべきことがあります。例えば、「2月は計測期間が28日間(もしくは29日間)しかない。」ということです。
この事実を踏まえて、1月と2月の一日あたりのページビュー数を見てみましょう。
1月 | 2月 | |
---|---|---|
ページビュー数 | 520,000 | 500,000 |
日数 | 31 | 28 |
一日あたりのページビュー数 | 16774.19 | 17857.14 |
2.季節要因の把握
可能な限り、計測期間内の日数の違い以外にも数値の増減に影響を与える要因を把握しておきましょう。
上記の様な、過去2年分の月別の推移をそれぞれ分けてグラフで並べてみると、5月・8月・12月のタイミングでそれぞれページビュー数が減少していることがわかります。
5月・8月・12月の3ヶ月で共通していることはなんでしょうか。一つの例として、いずれの月も長期休暇があることではないでしょうか。
- 5月:ゴールデンウィーク
- 8月:夏休み・お盆休み
- 12月:年末年始
サイトのターゲットが学生と仮定すると、このサイトにおける「学生×長期休暇」という関係性はページビュー数を減少させる要因になることが見えてきます。
トレンドデータからの異常値検出
ここからは、トレンドデータから異常値を検出するポイントをご紹介させていただきます。
実数の推移を見ているだけでは異常値と判断しづらいとケースがあると思います。
そこで、少し視点を変え比率(前年比)の推移をグラフ化したものが下記になります。
極端な例ではありますが、このグラフでは4月に前年比100%を下回っています。これを異常値ととらえることは容易ですが、8月の様に単月の前年比では100%を超えているが推移でとらえると下落しているような場合は、異常値としてとらえるかどうかは見る人次第です。
そのような個人の感覚の差をなくすためには、共通の基準値を設けることが良いでしょう。
基準値の例の一つの例として「目標値」があります。
例えば前年比105%を目標値とした場合、8月は目標を下回る結果になりますので「目標を達成していない要因がある」という共通認識が持つことが出来ます。
まとめ
今回は、サイトのトレンド把握や異常値検出時に見る機会の多いトレンドデータの注意点と異常値検出のポイントについて下記を述べさせていただきました。
- ・推移を見る前にサイトの外で起きていること(月の日数の違いや季節要因)を考える。
- ・異常値の定義は人それぞれで違うため共通の基準値を設ける。
トレンドデータを蓄積しサイトの傾向分析を行うことで新たな発見につながるケースは多々あります。
今回ご説明させて頂いた注意点・ポイントをサイトの傾向分析に少しでも役立てて頂ければ幸いです。
パーソルビジネスプロセスデザインのWebアナリティクスサービス