「原因」を探るなら因子分析!読み方を知ってマーケティングに役立てる
2021年09月24日
「アンケートの選択肢が多すぎて、どう集約したり分析したりすべきか迷っている」
「性別や年代だけでなく、価値観や意識で比較したい」
「顧客の意見や要望がいろいろあって困る。根本的対策を立てることはできないか?」
もしこのような悩みがあるなら、「因子分析」が役に立つかもしれません。
因子分析は、一言で言えば「原因」を探るための分析手法です。
多くて解釈しにくいような変数をまとめるのに特に向いており、マーケティングだけでなく、心理学・社会学・医学など多くの分野で広く使われています。
- 因子分析とはどんな分析手法なのか?
- 他の手法とどのような違いがあるのか?
- ビジネスでは具体的にどう役立つのか?
この記事では、知っておきたい因子分析について解説します。
因子分析とは「原因」を探る分析手法
因子分析は、いくつかの変量データの背後にある共通因子を探りだそうとする考え方です。
多変量解析の手法の1つです。
- 因子分析とは
- 観測変数が潜在変数(因子)からどのような影響を受けているのかを明確にすることで、複数の観測変数を少数に要約できる分析手法のこと。
因子とは、ある現象の原因や先行条件となる共通的で潜在的な部分。
難しい言い方をしていますが、言っていることは実はシンプルです。
たとえば、親しい友人がある日急にため息をついていたり、スマホを前に考え込んでいたり、「うーん」と唸っていたりと言う様子が増えたとき、あなたはどう思うでしょうか?
おそらく「このような態度を急に取るのは、なにか原因があるのではないか?きっとなにか悩みがあるのだろう」と考える人が多いのではないでしょうか?
このように「すでに観測されているいくつかの相関の強いデータが”〇〇という共通の要素”によるものなのではないか?」と考えるのが因子分析です。
このとき、ため息や泣いている様子といった実際に観測できる事象を「観測変数」、相関の強い観測データに原因となっているであろう変数(「悩んでいるのではないか」という推測)のことを「潜在変数」や「因子」と呼んでいます。
因子分析が面白いのは、こういった原因となる変数を当てずっぽうや思い込みで考えるのではなく、きちんとした統計的根拠に基づいて、どの程度影響力があるのかを予測する点にあります。
因子分析は「知能」の研究からスタート
因子分析はもともと1904年に英国のチャールズ・スピアマンによって創案されました。
スピアマンはロンドン大学において、哲学の教授・心理学の教授を務めていましたが「具体的な知能テストや試験などの結果がどういう要素によって決定づけられているのか?」と考えたことから因子分析を提案しました。
先程はシンプルな1つの例を見てみましたが、もうすこし具体的な例で見てみましょう。
たとえば、国語・社会・算数・理科のそれぞれのテストの点数が分かっているとします。
このとき、テストの点数は目に見える数字なので、観測できるデータ=「観測変数」と考えることができます。
さて、このそれぞれの点数は一体どのような原因や条件から決定付けられたのでしょうか?
各教科の点数を分析した結果、
- どうやら国語で高得点を取る生徒は、社会でも高得点を取る傾向にあるらしい
- どうやら算数で高得点を取る生徒は、理科でも高得点を取る傾向にあるらしい
といったことが分かったとしましょう。
このときに、「国語と社会の得点に共通して影響する能力がありそうだ」「算数と理科の得点にも同様に共通して影響する能力がありそうだ」と考えることができます。
仮に、「文系の能力」「理系の能力」としておきましょう。
分析した結果、文系の能力は国語と社会に強く影響をおよぼす能力ですが、数学と理科にも少なからず影響があるようでした。ということは、影響の大きさは以下のように太い矢印と細い矢印で表す事ができそうです。(※太い矢印→影響力が大きい/細い矢印→影響力が小さい)
理系の能力についても同様に考えます。
これら共通する能力に加えて、実際にはそれぞれの教科に影響する固有の能力もあると考えられます。
このように、各教科の得点を分析することで、目には見えない「文系・理系」能力という少ない変数とそれぞれ固有の能力で各教科の点数を説明できるようになりました。
このときの文系・理系の能力を「共通因子(f)」
それぞれの教科固有の能力を「独自因子(e)」と呼びます。
◆因子分析の考え方
マーケティングで因子分析が役立つシーン
ビジネスにおいては、因子分析はどのように役立てられるでしょうか?
実際にアンケートをとったことのある方は、データの解釈に頭を悩ませたことがあるのではないでしょうか?
因子分析を用いることで、
- 多くの選択肢の原因や条件となる要素について気づくことができる
- 性別・年代といったデモグラデータではなく、意識や価値観に基づいたクラスター分けを行うことができる
- 売れ行きの良い商品やサービスについて、それが必要となっている背景や理由を把握できる
- 多くの顧客からブランドイメージを要約して知る
というように役立てることができます。
マーケティングだけではなく、心理学・社会学・医学などでも使われる使いやすい分析手法です。
多変量解析と因子分析
因子分析は多変量解析のうちの一つの手法です。
◆多変量解析の主な分析手法
多変量解析とは、多くの変数データからなにかを予測したりデータを要約したりする手法です。分析手法はいくつも種類があります。
このうち、因子分析とよく似て紛らわしい主成分分析と重回帰分析について、違いを説明しましょう。
因子分析と主成分分析
因子分析とほとんど同じ時期に開発され、よく並べて語られるのが「主成分分析」です。
主成分分析は観測されたデータを要約するという点では因子分析と同じですが、
そのベクトルがまったく逆になっています。
因子分析が観測変数の原因や条件となる潜在変数を探るものであるのに対して、主成分分析は観測変数を総合化するための解析手法です。
重回帰分析と因子分析
因子分析とよく似ていると誤解されやすいのが「重回帰分析」です。
- 目的変数が、家賃や顧客満足度といった量的変数である
- すでにあるデータを要約するためではなく、未知のデータを予測するために用いられる
という違いがあります。
因子分析は重回帰分析の説明変数に使える変数を探す場面で使われることもあります。
因子分析で注目すべきデータと結果の読み方
実際に因子分析を実施したときに注目すべきデータについて説明しましょう。
因子分析ではいくつかキーワードとなるデータがあります。
因子分析の結果を読み解きながら、カンタンに押さえていきましょう。
ちなみに因子分析はExcel単体で行うことは難しいです。
しかし、Excel統計といったアドインソフトや、SPSS、SAS、Rといった統計ソフトウェアを使えば大部分を自動的に計算することができます。
今回、分析したい表などを統計ソフトで因子分析した結果、以下のような表がアウトプットされたとしましょう。
◆因子分析の結果(※ダミーデータ)
これはどのように見ていけばいいでしょうか?
まず最初に見たいのは、因子1~因子3の列です。
回答を分析した結果、
- 因子が3つある
- それぞれ人間関係、自己成長、ワークライフバランスに関する因子だった
ということが分かったようです。
このとき「人間関係」「自己成長」などとネーミングしているのは分析者自身で、ソフトが自動的に命名してくれるわけではないことに注意しましょう。
次に、それぞれの項目がどれくらい影響力があったのか、詳しく見てみましょう。
このエリアが因子負荷量を表しています。
- 因子負荷量
- 観測変数に対して共通因子がどれくらい影響があったのかを示す数値。
通常、因子負荷量が高い変数を考慮して因子の名前を付ける。
余裕があれば、それぞれの因子ごとにどれぐらい寄与しているかを見ておきましょう。
因子1が23%、因子2が15%、因子3が14%となっています。
- 寄与率
- それぞれの因子がどのぐらい質問項目のことを説明できているかという強さ。
今回の解析で因子1から因子3までの寄与率を累計すると52%(23%+15%+14%)になりました。
つまり、「3因子で9項目の情報の52%が説明できた」ということが分かりました。
- 共通性
- 観測変数が共通因子によって説明される程度を表す。
共通性というのは、共通因子の割合を表しています。共通性が1に近いほど共通因子の割合が高く、独自因子の割合が低いということになります。
各アンケートの回答者や回答者のクラスターの特徴を分析したい場合は、さらに因子得点を算出します。因子得点によって、共通因子から見た各回答者の意識や価値観を推測できます。
- 因子得点
- 回答者ごとに、それぞれの共通因子をどれくらい持っているかを示すもの。
今回の分析だと、「人間関係とワークライフバランスを重視するグループ」「自己成長を重視するグループ」「ワークライフバランスを重視するグループ」に分けられたようです。
これらの特性から、さらにクラスター分析などを行うこともできますね。
なお、どのぐらいの数値以上を色塗りでハイライトするかは、とくに決まった数値があるわけではなく、分析者によって決められます。
因子分析においての注意点
因子分析では、次のような注意点があります。
- 因子数・因子名・回転方法は分析者が決定する
- 用いることのできるデータに条件があり、一定量が必要
ポイント1.因子数・因子名・回転方法は分析者が決定する
因子分析では、因子の数と因子軸の回転を分析者が決定することにより結果を解釈します。
因子数と回転方法は、分析前に立てた仮説に基づいて決定されますが、その結果解釈がしにくければ、因子の数を増減させたり、回転方法を変更させたりして試行錯誤することになります。
誰が行っても同じ方法になるというわけではないという点に注意が必要です。
さらに、あらわれた因子の名前は分析者が解釈し主観で名付けることになります。
このとき、もととなる項目を網羅して納得感のある名前になっているかどうかは、分析者次第です。
ポイント2.用いることのできるデータに条件があり、一定量が必要
因子分析に用いるデータは、どのようなデータでも使えるというわけではありません。
まず、因子分析で用いることのできるデータは次の条件があります
- 数量データ
- 変数間の相関関係のあるデータ
さらに、データのボリュームとして次が望ましいです。
- 1つの共通を説明するのに、最低3つ~4つの質問項目が必要
- 回答者数は、観測変数の5倍~10倍
もちろん、もととなるデータに偏りがあれば、分析結果にも変化が現れる可能性があります。
まとめ
因子分析は、観測された複雑な事象の根本的な原因や前提条件を探り出そうとする分析手法です。
データの条件が整えば使いやすく、実際の施策にも活かしやすい手法ですので、ぜひ考え方や結果表の読み方を押さえておきましょう。
- サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
-
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
- スピーディーにアンケートデータを収集するには
- お客様ご自身で好きな時にアンケートを実施する方法
- どこの誰にどれくらいリーチができるか
ぜひこの機会にお求めください。 - 資料請求する