マーケット・バスケット分析で学ぶ「アソシエーション分析」
アソシエーション分析とは、データマイニングで用いられる解析手法の一つでデータ同士の結びつきの強さを求める分析方法で、代表的なものには「マーケット・バスケット分析」があります。
アソシエーション分析はマーケット・バスケット分析に限らず、「検索時同時に利用される単語を探す」等のデータ関連性を求める様々な分析に応用できますが、今回はマーケット・バスケット分析を使った分析事例をご紹介します。
目次
1.どのような場合に使われているか
「陳列棚の配置変更を行って売上を向上させる効果的な配置にしたい。」とした場合、
ある商品同士の関連性を見つけ出せれば意図的に近くに配置させることでクロスセルのアプローチが可能です。
以下の表は介護カテゴリ商品の売れ行きが好調なとある店舗のカテゴリ別顧客数です。
介護カテゴリとの相性が良い他のカテゴリを探してみますと、顧客数も多い、同時購入顧客数も多い「生理用品」「食品」が良さそうに見えます。
しかし、安易な判断は要注意です。コンビニの飲料などのようにどの商品とも一緒に買われやすい商品も存在するのです。
そこで、本当に強い相関があるのか判断するために評価指標を使います。
2.アソシエーション分析の評価指標
[支持度]
併売顧客数(同時購入顧客数) ÷ 全体顧客数
全体の中でAもBも買う確率。併売する顧客が全体のどの程度の割合なのかを判断。
[信頼度]
併売顧客数(同時購入顧客数) ÷ Aの顧客数
Aを買った人がBも買う確率。AとBの相関、関連の強さを判断。
[期待信頼度]
Bの顧客数 ÷ 全体顧客数
Bを買う確率。B単独の人気を判断。
[リフト]
信頼度 ÷ 期待信頼度
信頼度と期待信頼度の比率。B単体の人気度とAとBの因果関係どちらが強いかを判断。
指標を見るときは、1つだけ確認するのではなくすべての指標を確認することが重要です。
信頼度、支持度のみで判断した場合、上記で出たコンビニ飲料のような意図しないデータを誤って関連が強いと判断してしまいます。
3.評価指標の活用
先ほどの表に、評価指標を追加すると以下の表になりました。
相関が強いと思っていた「生理用品」「食品」のリフト値はそれほど高くないようです。
代わりに「ビニール手袋」「ガラス容器」のリフト値が高くなっていますが、「ガラス容器」は支持度、信頼度がそれほど高くないですね。
つまり、介護カテゴリとよく買われる商品は「ビニール手袋」と言えそうです。
このように評価指標を使用すると、一見高いと判断できそうな値があったとしても惑わされることなく、本当に相関が強いと言える関連性を発見することができます。
4.まとめ
アソシエーション分析はデータ関連性を見るためのとても有効な分析手法です。
しかしながら、どんなに素晴らしい分析手法でも分析しただけでは意味がありません。
分析結果から施策を導き出し、PDCAを回していくことが重要です。
常に「課題を解決すること」を意識して分析をしてみてください。
また、弊社ではBIツールを用いたデータ活用推進やデータ基盤整備に関するご相談も随時承っております。
サービスの詳細は下記からご覧ください。