シンプルでありながら汎用的なデータマイニング手法がデシジョンツリー分析です

データマイニングの主な利用場面は「予測」「クラス分け」「バスケット分析」になります。
デシジョンツリー分析はその全てをサポートできる強力な手法で、国際データマイニング学会の調査によると、 C5.0、C4.5と呼ばれるデシジョンツリーが使用率No.1となっています。

デシジョンツリーを作成する方法はいくつかありますが(ジニ系数、エントロピー、情報量など)、データを木構造にして分析にすることが基本です。
ツリー構造化することのメリットは計りしれません。
・視覚的な「思考の地図」として使い易い
・因果関係が解り易い
・木構造は小さな木(クラスター)から構成されているので、問題を括ることができる
これらのメリットを具体的に見てみましょう。

ロイヤリティの高い顧客獲得と育成に使える

売上購入金額が多い顧客層を簡単に探し出すことができます。
下図は、ある自動車メーカーのサービス部門の顧客データベースと売上データを分析した例です。 購入金額を目的変数とし、顧客属性を説明変数としたデシジョンツリーの一部です。 最も購入金額の高い顧客属性がツリー状に表現されています。 (手法としてはAIDと呼ばれる多段層化分析手法を使用)

「国産上級車に乗った30歳代で、タイヤを購入した後、内外装やサスペンションチューニングを行い、 最終的に来店回数10回以上になったお客様」(=車マニア層かもしれません)
この内、「上級車に乗っていて、来店回数が10回以上もある」ことは、購入金額が多くなることと強い相関があるだろうことは、 容易に想像がつきます。問題は「30歳代、タイヤ購入経験有り、内外装品購入有り、 サスペンションチューニング経験有り」の部分です。
ロイヤリティ顧客の取り込み⇒⇒「30歳代の国産上級車ユーザー」対象キャンペーン
ロイヤリティ顧客の育成⇒⇒「内外装品・サスペンション」リコメンド
などが効果が有る施策であることが簡単に分かります。

来店頻度アップや新規客獲得に使える

単純に来店頻度を上げたい場合や、新規客をとにかく増やしたいといった場面でも威力を発揮します。 デシジョンツリーの中で、来店頻度に関する属性が出てくる部分を探索します。

下図も同じデシジョンツリーの一部で、来店頻度に関する属性が出ています。
「6〜9回来店しているお客様と2回以下のお客様のパターンが似ており、 その特徴は日産、スバルの上級車ユーザーでホイールアライメント調整を行った経験が有る」と判ります。

あらゆるユーザー層を獲得するのではなく、特定のメーカーに乗った人を対象にアライメント割引キャンペーンを打つことが効果的だと言えるでしょう。

予測やリコメンデーション、テキストマイニングに使えます

ある顧客が来店したり、webサイトに訪れた場合に、その顧客の属性が解れば、
どの程度の購買をするだろうかという予測問題
何をお勧めすれば購入確率が上がるのだろうかというリコメンデーション
など、様々な分野のデータマイニングやテキストマイニングにデシジョンツリーは活用されています。
このことが、使用率No.1の強力な分析手法と言われる所以です。

↑ ページTOPへ

データマイニング
ケーススタディ

最新のデータマイニング&テキストマイニングに関するケーススタディを公開しています。

ケーススタディ【1】

需要予測から”売れない”要因を解明してみよう!
>>詳しくはこちらから


ケーススタディ【2】

口コミからブランド・ポジションを把握しよう!
>>詳しくはこちらから


ケーススタディ【3】

課題の優先順位を付けてみよう!
>>詳しくはこちらから


ケーススタディ【4】

デシジョンツリーで優良顧客開拓!
>>詳しくはこちらから