コレスポンデンス分析とは?手順や注意点を幅広く解説

2021年09月15日

コレスポンデンス分析とは?手順や注意点を幅広く解説

分析手法の1つである「コレスポンデンス分析」をご存知でしょうか?

コレスポンデンス分析は、
カテゴリー数が多くてクロス集計結果のコメントがまとめにくい
グラフではない表現方法で、一目瞭然で結果を示したい

こんなときに使える分析手法です。

コレスポンデンス分析は一覧性が高く、初めて見たひとでも理解しやすい手法です。
企画やプレゼンテーションに関わる人はぜひ知っておきたい便利な分析です。

この記事ではコレスポンデンス分析とは何なのか、手順やメリット・デメリット、さらに注意点やよく似た分析手法である主成分分析まで幅広く解説します。

コレスポンデンス分析とは

コレスポンデンス分析は多変量解析の1つで、クロス表を元に2変量の関係をマッピングする手法です。
対応分析、頻数III類、もしくは省略して「コレポン」と呼ばれることもあります。

20代~50代の男女がコンビニで買うお昼ご飯

20代~50代の男女がコンビニで買うお昼ご飯(※ダミーデータ)

「コレスポンデンス分析と『数量化III類』との違いは?」と聞かれることがありますが、この2つに根本的な違いはありません。

コレスポンデンス分析はパリ第6大学のジャン=ポール・ベンゼクリ氏によって開発された分析手法です。数量化III類は、1940年代から50年代に林知己夫氏によって開発された日本独自の多次元データ解析手法です。生まれた国は違いますが、どちらも根本の考え方やアルゴリズムは同じです。

コレスポンデンス分析の活用

コレスポンデンス分析を行うとクロス集計結果を散布図にして分かりやすく結果を示すことが出来ます。

クロス集計とは、アンケートなどの調査をして得られた回答を属性や別の回答とかけ合わせることで、全体数だけではない違いを見られる集計方法のことです。

 

20代~50代の男女がコンビニで買うお昼ご飯

20代~50代の男女がコンビニで買うお昼ご飯(※ダミーデータ)

上の図のように、カテゴリーが多くクロス集計で意味がつかみにくい場合でも、散布図にすることで俯瞰したり、変化を追ったりすることが簡単になります。

 

◆コレスポンデンス分析が有効な場面

  • 年齢や性別といった属性で商品や企業イメージを知る
  • 競合と自社のブランドイメージのポジショニングマップを作る
  • ターゲット層がどのような特徴・ニーズを持っているのか実態を把握する

コレスポンデンス分析は、クロス集計表であればデータの種類をほぼ問わずに解析可能なため、幅広いデータに用いることができます。

コレスポンデンス分析の手順

コレスポンデンス分析を行うためにはどうすれば良いのでしょうか?

コレスポンデンス分析の機能は、Excelには標準搭載されていません。利用するためにはExcel統計などのアドインソフトを追加することが必要になります。
フリーウェアの「R」や「SPSS」「Python」「JMP」「SAS」「MATLAB」などの統計ソフトがあれば、そちらを利用しても良いでしょう。

実際の手順は以下の通りです。

コレスポンデンス分析の手順

1つずつ解説しましょう。

手順1.解析目的に応じて、クロス集計表を準備する

まずは、分析の元となるクロス集計表を準備します。

コレスポンデンス分析は、クロス集計の項目の関係を視覚的に分かりやすく表す分析手法です。

特にカテゴリー数が多く一覧して傾向がつかみにくいようなクロス表に対して効果を発揮します。

分析に使うデータはもちろん自社や個人で行ったアンケートでもすでに公開されているものでもかまいません。
クロス表であれば、頻数表でも平均値表でも標本別の回答結果を表形式にしたローデータでも解析可能で、複数回答でも扱うことが出来ます。

 

20代~50代の男女がコンビニで買うお昼ご飯

20代~50代の男女がコンビニで買うお昼ご飯(※ダミーデータ)

手順2.コレスポンデンス分析を実施する

実際に統計ソフトを用いて、コレスポンデンス分析を実施します。

基本的に、コレスポンデンス分析のアルゴリズムでは、まずはカイ二乗検定の判定結果から行・列のカテゴリにスコアを与えます。そして表頭(列項目)と表側(行項目)の相関が最大になるように並べ替え、グラフ化します。

20代~50代の男女がコンビニで買うお昼ご飯

20代~50代の男女がコンビニで買うお昼ご飯(※ダミーデータ)

3.結果を解釈する

出来上がったグラフを見ながら解釈を行います。
類似性が高いカテゴリーは何か、カテゴリーの近さから布置図を丸で囲んだり、軸解釈を行います。

コレスポンデンス分析のメリット・デメリット

コレスポンデンス分析のメリット・デメリットにはどんなものがあるのでしょうか?

コレスポンデンス分析のメリット

コレスポンデンス分析のメリットは以下の通りです。

  • 時間をかけずにカテゴリー間の関係を把握できる
  • 複雑なクロス表を視覚化できる
  • クロス表などのデータがあれば分析が可能

まず、コレスポンデンス分析は視覚的にカテゴリー間の関係を把握できるメリットがあります。
クロス表は項目が多くなると一覧性が悪くなり関係が分かりにくくなりますが、コレスポンデンス分析を使えば直感的に結果を把握することができます。
初めての人でもわかりやすく結果を把握することができるため、すぐにアイデアや施策に繋げたいようなシチュエーションに向いています。

コレスポンデンス分析に必要なのはクロス表などのデータのみです。インターネット上に公開されているデータを利用するのも可能であるため、幅広い分析に役立てることが出来ます。

コレスポンデンス分析のデメリット

コレスポンデンス分析のデメリットは何でしょうか?

  • 分析結果からサンプルサイズを把握できない
  • クロス表の回答数や割合の大きさが点の位置関係と一致するとは限らず、データの解釈を間違う可能性がある

コレスポンデンス分析では、回答者数などのサンプルサイズを反映できません。定量的な観点で解釈したい場合には、コレスポンデンス分析だけでなくクロス集計表も合わせて確認する必要があります。

また、コレスポンデンス分析を用いるとデータの解釈を間違ってしまう可能性もあります。なぜなら、サンプルサイズを確認し忘れたり、クロス表で詳細を確認するミスが発生するかもしれないためです。

コレスポンデンス分析の注意点

コレスポンデンス分析を行うときには、いくつか注意があります。

  • 軸の意味付けをする
  • 縦軸と横軸は合わせる
  • コレスポンデンス分析は他の分析に比べて元データがこぼれてしまう可能性が高い
  • サンプルサイズが分析結果に反映されないことを把握する
  • 異なる項目の位置関係は、原点からの方向で判断する

分析者は軸の意味付けを行い、縦軸と横軸の目盛りを合わせるなど様々な工夫を行う必要があります。

また、コレスポンデンス分析は元データを要約する分析方法のため、その元データがこぼれてしまう可能性が主成分分析などに比べて高いともと言われています。どの程度元データが反映されているかは、固有値や寄与率を参照して確かめると良いでしょう。

固有値
各軸が含んでいる情報がどれくらい大きいのかを表す指標
寄与率
その軸が元のデータの何割を説明できているかを示した指標

一般的には固有値が1以上、2つの軸の寄与率を合計した累積寄与率が80%を越していれば、元データの反映率は高いと言えます。

異なる項目の位置関係は、原点からの方向で判断するようにしましょう。原点から見て同じ方向に2つのカテゴリーがあれば、その2点間に距離があっても同様の意味付けが可能になるからです。

ただし、コレスポンデンス分析を見た目だけで判断するのは危険です。一見距離が近いカテゴリ同士でも、データにしてみると類似性が高いわけではないこともあるため、分析する際は細かい箇所まで見るようにしましょう。

コレスポンデンス分析と主成分分析の違い

コレスポンデンス分析に似た分析方法として、「主成分分析」があります。どのような違いがあるのでしょうか?

コレスポンデンス分析も主成分分析もどちらも目的は、分析対象としている多数の変数が持っている情報をできるだけ少ない次元に圧縮して表現することです。
しかし、このときの大きな違いは対象とするデータの前提条件です。コレスポンデンス分析は質的データ(名義尺度)、主成分分析は量的データ(感覚尺度)を扱います。

 

質的データと量的データ

◆データの種類

データの種類

まとめ

コレスポンデンス分析を使うと、複雑なクロス集計表も視覚的に分かりやすく表現できます。

コレスポンデンス分析は、データを簡単に視覚化したい場面では役立ちますが、分析をする場合には注意が必要です。特徴を押さえて有効に役立てましょう。

サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
3分で読めるGMOリサーチ&AIのサービス
最後までお読みいただきありがとうございます。
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
  • スピーディーにアンケートデータを収集するには
  • お客様ご自身で好きな時にアンケートを実施する方法
  • どこの誰にどれくらいリーチができるか
などをまとめた資料をお配りしております。
ぜひこの機会にお求めください。
資料請求する