データマイニングの主な利用場面は「予測」「クラス分け」「バスケット分析」になります。
デシジョンツリー分析はその全てをサポートできる強力な手法で、国際データマイニング学会の調査によると、
C5.0、C4.5と呼ばれるデシジョンツリーが使用率No.1となっています。
デシジョンツリーを作成する方法はいくつかありますが(ジニ系数、エントロピー、情報量など)、データを木構造にして分析にすることが基本です。
ツリー構造化することのメリットは計りしれません。
・視覚的な「思考の地図」として使い易い
・因果関係が解り易い
・木構造は小さな木(クラスター)から構成されているので、問題を括ることができる
これらのメリットを具体的に見てみましょう。
売上購入金額が多い顧客層を簡単に探し出すことができます。
下図は、ある自動車メーカーのサービス部門の顧客データベースと売上データを分析した例です。
購入金額を目的変数とし、顧客属性を説明変数としたデシジョンツリーの一部です。
最も購入金額の高い顧客属性がツリー状に表現されています。
(手法としてはAIDと呼ばれる多段層化分析手法を使用)
「国産上級車に乗った30歳代で、タイヤを購入した後、内外装やサスペンションチューニングを行い、
最終的に来店回数10回以上になったお客様」(=車マニア層かもしれません)
この内、「上級車に乗っていて、来店回数が10回以上もある」ことは、購入金額が多くなることと強い相関があるだろうことは、
容易に想像がつきます。問題は「30歳代、タイヤ購入経験有り、内外装品購入有り、
サスペンションチューニング経験有り」の部分です。
ロイヤリティ顧客の取り込み⇒⇒「30歳代の国産上級車ユーザー」対象キャンペーン
ロイヤリティ顧客の育成⇒⇒「内外装品・サスペンション」リコメンド
などが効果が有る施策であることが簡単に分かります。
単純に来店頻度を上げたい場合や、新規客をとにかく増やしたいといった場面でも威力を発揮します。
デシジョンツリーの中で、来店頻度に関する属性が出てくる部分を探索します。
下図も同じデシジョンツリーの一部で、来店頻度に関する属性が出ています。
「6〜9回来店しているお客様と2回以下のお客様のパターンが似ており、
その特徴は日産、スバルの上級車ユーザーでホイールアライメント調整を行った経験が有る」と判ります。
あらゆるユーザー層を獲得するのではなく、特定のメーカーに乗った人を対象にアライメント割引キャンペーンを打つことが効果的だと言えるでしょう。
ある顧客が来店したり、webサイトに訪れた場合に、その顧客の属性が解れば、
どの程度の購買をするだろうかという予測問題
何をお勧めすれば購入確率が上がるのだろうかというリコメンデーション
など、様々な分野のデータマイニングやテキストマイニングにデシジョンツリーは活用されています。
このことが、使用率No.1の強力な分析手法と言われる所以です。
最新のデータマイニング&テキストマイニングに関するケーススタディを公開しています。
需要予測から”売れない”要因を解明してみよう!
>>詳しくはこちらから
口コミからブランド・ポジションを把握しよう!
>>詳しくはこちらから
課題の優先順位を付けてみよう!
>>詳しくはこちらから
デシジョンツリーで優良顧客開拓!
>>詳しくはこちらから