アソシエーション分析は、お客様に最適な商品を推奨する仕組み作りに欠かせない分析手法

買い物カゴに同時に入れられた商品同士の「関連」を分析することから名付けられた手法です。
このことから、アソシエーション分析は「バスケット分析」とも呼ばれています。

One to Oneマーケティングが提唱されて以来、お客様1人ひとりに合せた商品の提案がマーケティングの大きなテーマになってきました。パーソナライズ・マーケティングと呼んでもいいでしょう。
「1人ひとりに合わせる」ために、例えばレストランで前回注文したオーダーを元に嗜好も分析し今回お勧めするメニューを提示したり、通販サイトである商品を購入した人に関連の高い商品を個人別に変えながらお勧めする、といった方法が取られています。
このように「1人ひとりに合せた商品の推奨」をレコメンデーションシステムと言います。

レコメンデーションには様々な方法があり、例えば人気順に商品を勧める「売れ筋ランキング」などもその1つです。 様々な方法の中でも効果があるとされる方法が「アソシエーション方式」です。
・レストランの例で言えば、前回Aというメニューを注文したした人は、次にBメニューを注文する確率が高い
・通販サイトの例では、Dという商品を購入した人はEも同時に買う確率が高い
といったデータにもとづいてレコメンデーションを行う仕組みです。

アソシエーション分析は、シンプルな分析手法なので、導入が簡単

アソシエーション分析は簡単な計算ロジックゆえに、例えばECサイトなどでの実装が容易です。
A、B、Cという3つの商品があった場合、組み合わせはA〜B、B〜C、A〜C、A、B、C単独購入という6つパターンが発生します。 このパターンのことをアソシエーションでは「ルール」と呼んでいます。
ECサイトのカートや、ショッピングモールでレジが別々になっている場合は、 購入時刻データが取得できるため、組み合わせの順序を考慮し、ルールはさらに増えることになります。 ルールのうち前半を条件部と呼び、後半を結論部と呼びます。
A〜Bの場合、Aが条件部、Bが結論部となり、A単独購入なら、条件部はA、結論部は「無し」です。

ここでは順序を考慮しないケースで説明すると、分析方法は次のようになります。
@購入顧客合計数を算出する。
AA、B、Cそれぞれの購入数を算出する。
BA〜B、B〜C、A〜C、A、B、C単独購入6つの組み合わせそれぞれの売上数を集計する
C B÷Aをそれぞれ計算する=「確信度」と呼びます。

「確信度」の計算方法は、(A〜B)÷Aというように、ルールを分子に置き、ルールの条件部を分母に置きます。 つまり、Aという商品が売れたうち、Bと一緒に買われた確率を求めているわけです。 全てのルールについてこれを計算し比較すれば、AとBの組み合わせが他のルールより強いか弱いかが判定できます。
関連が強ければ、Aを購入した人にBを勧めれば、Bの購入確率は高くなるはずである、という簡単な分析です。
この「確信度」だけからリコメンデーションを行うのも間違いではないのですが、少しスパイスを加えます。

もし、Bが圧倒的に良く売れる商品だった場合、いくらA〜Bの関連が強くても、それは「当たり前の事」になってしまいます。 リコメンデーションされるお客様の立場にしてみると、「Bなんていう売れ筋を勧められてもなぁ・・・」などとなりかねません。 そこで結論部(上の例で言えば商品B)の評価をしてみる必要があります。
結論部の評価は、次の分析で行います。

D A÷@をそれぞれ計算=「支持度」と呼びます。

Bの売上数を総顧客数で割るだけです。単純にBの購買率を求めるわけです。これを「支持度」と呼びます。
支持度が高ければ「当たり前の事」なので、Aを購入した人に殊更Bを勧める必要は無くなってしまいます。 ところが、支持度が低い場合は「特殊なルールなので、採用する価値がある」=Aを購入した人にBを勧めれば購入率がアップする可能性がある、と判断できます。
では、支持度が高いか低いかはどう判断するのでしょうか?リコメンデーションを自動的に行うことができれば、それに越したことはありません。 支持度が高いか低いか、つまりそのルールを採用し、リコメンドするかどうかは、次の分析で判断します。

E C÷D=確信度/支持度=「改善度」と呼びます。

具体的な数値で見てみましょう。総顧客数が100人、Aの購入者数が30人、そのうちBと一緒に買った人が15人だとします。 仮にBの購入者数が80人もいたら、改善度はどうなるでしょうか。
確信度=15人÷30人=0.5
支持度=80人÷100人=0.8
改善度=0.5÷0.8=0.625

では、Bの購入者が20人の場合を見てみましょう。確信度は上の計算と同じです。
支持度=20人÷100人=0.2
改善度=0.5÷0.2=2.5

つまり、Bの購入が珍しいことであればあるほど、改善度は高い数値をとることになります。
一般的に「改善度>1」なら、そのルールは採用しても問題はありません。
逆に「改善度≦1」なら、そのルールは採用すべきではありません。

このように、非常に簡単な分析でリコメンドルールを決めることができるため、アソシエーションは導入が簡単で、かつ強力なツールとなっているのです。

一歩進んだリコメンデーション=協調フィルタリング

商品の組み合わせの改善度だけからリコメンドを行う問題点の一つに、「顧客特性を反映できない」という点が挙げられます。 多くのECサイトでは顧客の年齢・性別・職業・趣味などのデータを収集しているのですから、これを活かさない手はありません。

例えば「ブランデーは葉巻と一緒に購入される」というルールがあったとします。
これは、男性には良く観られるルールかも知れませんが、ではブランデーを買った女性に葉巻をリコメンドすることは妥当でしょうか? 女性の場合、例えばブランデーケーキの材料としてベーキングパウダーをお勧めしたほうが良いのではないでしょうか?

このように、顧客特性を反映してリコメンデーションを行う方法が「協調フィルタリング」と言われています。
これも分析方法は簡単で、顧客特性データを元に、それぞれの顧客の相関を求めるだけです。男性と女性では相関は低くなるので、当然違う商品を勧めるべきですし、女性同士なら相関は高いので、女性が良く購入する商品を勧める、といった具合です。
性別だけでなく、年齢や職業、趣味など個人の特性に関わるデータを総合的に判断して、相関を求めます。

ECサイトなどでの実装はこれまた簡単で、例えばブランデーの商品ページを見ている人に対し、その人の特性と相関の高い人が過去にブランデーと一緒に購入した商品をリコメンドする、というロジックになります。

無料ツールでリコメンデーションシステムを導入可能です

このようにアソシエーション分析や協調フィルタリングを使ったリコメンデーションシステムは、ECサイトや検索サイトで効果を発揮します。
今やこれらの分析をパッケージ化したツールが無料で使えるようになっており、ECサイトにも簡単に組み込むことが可能です。 これから導入をお考えなら、一度無料ツールについてお問い合せ下さい。

>>お問い合せはこちらから

↑ ページTOPへ

データ・マイニング
ケーススタディ

最新のデータ・マイニングに関するケーススタディを公開しています。

ケーススタディ【1】

需要予測から”売れない”要因を解明してみよう!
>>詳しくはこちらから


ケーススタディ【2】

口コミからブランド・ポジションを把握しよう!
>>詳しくはこちらから


ケーススタディ【3】

課題の優先順位を付けてみよう!
>>詳しくはこちらから


ケーススタディ【4】

デシジョンツリーで優良顧客開拓!
>>詳しくはこちらから