決定木分析とは?メリットやマーケティングでの活用方法を解説

2022年07月08日

decision-tree

決定木分析(デシジョンツリー)とは、ツリー構造を活用して、データの分類やパターンの抽出ができる分析手法です。

機械学習や統計分野におけるパターン抽出の他に、マーケティングではターゲット選定や顧客満足度に影響を与えている要素を発見したいときなどに活用されます。

本記事では決定木分析の概要やメリット、ビジネスにおける活用シーンを解説します。

決定木分析(デシジョンツリー)とは

決定木分析(デシジョンツリー)とは、ツリー構造を用いて目的変数に影響を及ぼしている説明変数を見つけ出す分析手法です。

決定木分析は、機械学習によるデータ解析で複数パターンを抽出したり、データの中から特定の情報を取り出し整理したりする場合に活用されます。

データ分類や抽出ができるという特性を活かし、アンケート調査の結果や顧客情報をもとに消費者の行動分析も可能です。

消費者の行動分析から、ターゲット選定や顧客ロイヤリティに影響を与えている要素を見つけることに役立つため、マーケティング戦略や施策に応用できます。

決定木分析の見方

1_決定木分析の見方.jpg
※分析結果の樹形図の一部分を抽出

決定木分析では、ツリー状の樹形図を用いてデータを分類していきます。

例えば、あるECサイトで商品Aを最も購入しているセグメントを発見したい場合は、上記の図のように顧客データを分類していきます。

まずは、目的変数を設定しましょう。
目的変数は、決定木分析の結果に大きく影響する項目のため、知りたい情報にあわせて最適な項目を設定します。

上記図の場合は、購入者の顧客セグメントを見つけるために「商品Aの購入・非購入」を目的変数として用います。

次にデータを説明変数で枝分かれさせて分類していきます。
説明変数の結果を上から確認しながら読み進めていきましょう

上記の図では「性別」「居住地」「年代」に分けていき、「男性・首都圏在住・39歳以下」の購入人数が最も多いことがわかりました。

決定木分析は設定した目的変数に影響する説明変数を明確にすることで、狙うべきターゲット層を見つけ出し、影響を与えている要素を探りたいときに活用できます。

決定木分析の各名称

決定木分析は、樹形図を用いて分析します。

樹形図の名称や意味を把握していると、図を作成したり、結果を分析したりする際に役立ちます。

決定木分析で用いる樹形図の名称は、以下の通りです。

2_決定木分析の各名称.jpg

◆各箇所の名称と意味

1.ルート(決定)ノード
決定木分析の起点となる箇所。ルートノードを起点として、データを分類する。決定木分析全体に与える影響が大きい項目を設定する。四角形で描くことが多い。
2.ブランチ
ノード同士を結ぶ線。
3.チャンスノード
「各ノードから導き出した結果」を示す箇所。円形で描くことが多く、1つのノードからは、少なくとも2つの結果が生まれる。
4.リーフ(エンド)ノード
最終的な分類結果や結論を示す箇所。三角形で描くことが多い。

樹形図を作成するときには、よく使用する図形や名称を理解しておきましょう。

決定木分析の活用シーン

決定木分析は、パターン抽出やデータの分類ができるためアンケート結果などから消費者の行動パターンや傾向がわかります。

マーケティングでは、以下のような自社施策の策定やターゲット選定などに役立ちます。

  • 商品やサービスのターゲット選定
  • 顧客満足度に影響がある要素の特定
  • 顧客離脱につながる要因の把握

商品やサービスのターゲット選定

決定木分析を活用し、購買データやアンケート結果を分析すると「どのような顧客層がサービスのターゲットになりうるか」を把握できます。

例えば、以下のような情報が活用できます。

◆ターゲット選定に活用できる情報例

  • アンケート調査結果
  • 購買履歴
  • 会員登録情報
  • メルマガへの登録情報
  • SNSのフォロワー属性

購買につながりやすい層がわかれば、ターゲット属性に合うマーケティング施策の策定が可能です。

顧客満足度に影響がある要素の特定

決定木分析を活用すれば、アンケート結果などから顧客満足度に影響を与えている要素を特定できます。

例えば、顧客満足度に関するアンケート結果から「どのような要望や不満が多いのか」をパターン別に分類していくことで、顧客満足度に影響を与える項目を洗い出せます。

他にも以下の情報を用いて、顧客満足度に関わる要素を分析することもできます。

◆活用できる情報例

  • 購買履歴
  • リピート顧客へのアンケート調査
  • クーポン利用者データ

顧客満足度に影響する項目を把握すると、優先的に改善すべき点の判断も可能です。

顧客離脱につながる要因の把握

決定木分析では、アンケートや購買履歴、顧客情報をもとに、顧客が離脱する原因となっている要素を見つけ出したいときにも活用できます。

例えば、サービスの退会者と継続者を年代や性別、年収などさまざまな要素で分類していき、退会者に多いセグメントや行動パターンを発見することも可能です。

他にも、以下のような顧客行動やデータを分析してもよいでしょう。

◆離脱要因の特定に活用できる例

  • 離脱時のアンケート
  • DMへの応答履歴
  • 問い合わせ電話の履歴

離脱の要因を特定できれば、ターゲットの練り直しや商品機能の改善、顧客対応の見直しをして顧客ロイヤリティの向上にも役立ちます。

マーケティングでの決定木分析のメリット

マーケティングで決定木分析を用いると、以下のようなメリットがあります。

  • 膨大な量のデータを分析できる
  • データを分類して優先順位がつけられる
  • データを可視化できる
  • 設問形式・データ形式を問わず分析できる

決定木分析を活用すれば、さまざまな種類のデータを柔軟に解析できます。

膨大な量のデータを分析できる

決定木分析は、アンケートの集計結果など膨大な量のデータを可視化して分析したいときに活用できます。

集計でよく用いられるクロス集計は、1つ1つの要素を算出できるのでデータ集計の際に役立ちますが、結果に影響を与えている説明変数が見つかれば、説明変数ごとにクロス集計が必要となります。

例えば、新製品Aに関するアンケート項目を男女別・年代別でクロス集計した場合、以下のようになります。

3_クロス集計の表.png

クロス集計を用いるとセグメントなど要素ごとに分析できますが、結果を導き出すためには要素ごとに何度もクロス集計を繰り返さなければいけません。

一方決定木分析では、ひとつの樹形図上で複数パターンを視覚的に分析できるため、大量のデータを効率よく分析できます。

▼関連記事
クロス集計表とは?基礎知識と賢い活用法

データを可視化して優先順位がつけられる

決定木分析では、目的変数に対し、どの説明変数が影響を及ぼしているのかを分析できるため、セグメントごとに優先順位をつけられます。

また樹形図を用いて結果を可視化できるため「どのような関係性で影響しあっているのか」という解釈も容易です。

結果の可視化により、データの読み間違いなども起こりにくくなります。

設問形式・データ形式を問わず分析できる

決定木分析のメリットは、アンケートの設問方式(数値回答・単一回答・複数回答)やデータ形式を問わず分析できる点です。

例えば、以下のようにアンケート調査のデータに数値や質的変数など複数の形式があっても分析できます。

◆アンケート調査のデータ例

  • 性別(1:男性、2:女性)
  • 年代(1:10代~20代:、2:30代~40代、3:50代~60代)
  • 購入金額(1:1,000円未満、2:1,000円~4,999円、3:5,000円以上)
  • 来店頻度(1:初めて、2:月1~2回、3:月3回~4回、4:月5回以上)

同じ定量データのなかには、上記のデータのように意味合いが異なる数値が含まれることがあります。

決定木分析を用いれば、それぞれの項目で分岐が行え、樹形図上では並列的にデータを見せることができます。

決定木分析をマーケティングで活用する際の注意点

マーケティングで決定木分析を活用するときには、以下の注意点があります。

  • 枝分かれの設問を適切に設定する
  • 一部のデータを深掘りしすぎてしまう恐れがある

それぞれ解説していきましょう。

枝分かれの設問を適切に設定する

樹形図の起点となる枝分かれは、分析結果に大きな影響を与えるため、最適な内容を設定できているか確認してから分析を実施しましょう。

「顧客満足度が高い層を把握したい」「商品に興味を持っているユーザー層を知りたい」など分析する目的をもとに、関連が強い要因を起点として順番に枝分かれさせていくとよいでしょう。

例えば、スポーツブランドが「日常的に運動をしていない人」をターゲットに新商品を開発するために、ユーザー調査を実施したとします。
ユーザー調査の結果を決定木分析する際には、最初の枝分かれとなる目的変数に「運動に関心があるか・ないか」を設定するとよいでしょう。

一部のデータを深掘りしすぎてしまう恐れがある

決定木分析は一部のデータを過剰に深掘りすると、深掘りしたデータにのみ適した結果が導き出されてしまい、データ全体の傾向が掴めなくなってしまいます。

例えば、以下の図にある商品Aの購入者のセグメントに「家族構成」や「年収」などの項目を追加してさらに深堀することも可能です。

項目を追加しすぎてしまうと、顧客が絞られ過ぎてしまい該当数も少なくなってしまいます。

4_購入者のセグメント.jpg

また枝分かれが増えて複雑になってしまうと、分析結果をうまく読み取ることが難しくなる恐れがあります。
樹形図の構造が複雑化しないように注意しましょう。

まとめ

決定木分析は、樹形図を用いて分析することで目的変数に影響を及ぼしている説明変数を見つけ出せます。

マーケティングにおいては、アンケート調査結果や購入履歴をもとに複数の顧客の行動を分析して、ターゲット選定や顧客満足度に影響を与えている要素を発見する際に活用できます。

見込み客の選定や顧客ロイヤリティの向上などに決定木分析を活用しましょう。

サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
3分で読めるGMOリサーチ&AIのサービス
最後までお読みいただきありがとうございます。
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
  • スピーディーにアンケートデータを収集するには
  • お客様ご自身で好きな時にアンケートを実施する方法
  • どこの誰にどれくらいリーチができるか
などをまとめた資料をお配りしております。
ぜひこの機会にお求めください。
資料請求する