クロス集計表とは?基礎知識と賢い活用法
2021年08月17日
「クロス集計」は、アンケート調査やネットリサーチでよく用いられる基本的な方法です。
表計算ソフトのピボットテーブル機能を使えば誰でも簡単にできてしまうクロス集計ですが、調査企画の段階で、予め集計方法と分析計画を立てておくことが活用のコツです。
この記事では、クロス集計の活用方法やデータの分析・作成方法を解説します。
クロス集計とは
※数表に使用しているデータはダミーです
クロス集計とは、2つ以上の質問項目の回答内容をかけ合わせ、回答者属性ごとの反応の違いを見るようなときに用いる集計方法です。
集計したデータを細分化して把握できるため、あらゆる統計的調査で使用されます。
上の表は、性別と年代別で、ある商品Aについての興味を分析したクロス集計表です。
このクロス集計表からは、例えば、以下のような客観的な事実を発見することができます。
- 全体値を見ると、「非常に興味がある」が最も高く44.8%、次いで「やや興味がある」が32.6%
- 性別で見ると、「非常に興味がある」と回答した人は男性のほうが女性よりも10ポイント以上高い。
- 年代別で見ると、「非常に興味がある」と回答したのは20代が最も高く57.2%
このように、クロス集計を利用すると全体の割合では見えてこなかった属性ごとの細かい違いが浮き彫りになります。
ちなみに、クロス集計表の
縦軸・表の左側は、表側(ひょうそく)
横軸・表の上側は、表頭(ひょうとう)
と呼ばれています。
※数表に使用しているデータはダミーです
クロス集計では、表側を「原因」、表頭を「結果」として因果関係を考えることになります。
なお、「性別×回答項目」のように2項目を取り上げるクロス集計を「二重クロス」、上の表のように3項目以上をかけ合わせるクロス集計を「三重クロス(多重クロス)」などと呼びます。
単純集計とクロス集計
クロス集計を行うためには、まずアンケートの質問項目ごとに各選択肢について何人回答したか単純集計(グランドトータル:GT)を行う必要があります。
※数表に使用しているデータはダミーです
単純集計では、選択肢ごとに回答数をカウントし、構成比を算出します。
このとき、回答数のことを度数(n)、構成比のことを割合(%)と呼んでいます。
単純集計の結果は通常、度数と割合の2種類が併記されます。
ちなみに構成比の算出方法は、回答形式によって異なります。
◆単純集計における構成比の算出方法の違い
- SA(シングルアンサー、単一回答)
- 総回答数に対する構成比を算出
- MA(マルチプルアンサー、複数回答)
- 回答人数を母数として構成比を算出。合計100%にならない
回答方法によって構成比が100%になるかどうかが変化することに注意が必要です。
さまざまなクロス集計
クロス集計は、質問項目と何をかけ合わせるかによって大きく2種類に分けられます。
- 属性クロス集計
- 設問間クロス集計
用語を覚えておく必要はありませんが、どういった分析の方法がよく行われているのかという点で内容を押さえておきましょう。
属性クロス集計
属性クロス集計は、回答者の属性ごとに回答の傾向を比較する方法です。
「女性はどういう傾向にあるのか?」「役職によりどんな違いがあるのか?」といった違いを見たい場合に使われます。
◆回答者属性の例
- 年齢
- 性別
- 職業
- 居住地
- 未婚/既婚
- 家族構成
設問間クロス集計
設問間クロス集計は、属性以外の2つ以上の質問項目をかけ合わせて比較する方法です。
「このように考えている人は、どういう傾向にあるのか?」「ある習慣がある人にはどのような違いがあるのか?」といったやや複雑な問いを調査したいときに使われますが、属性クロス集計よりも調査設計が込み入ったものになりやすいです。
◆設問のかけ合わせの例
- 運動に対しての評価(好き/普通/嫌い)と運動する頻度
- サービスの使用頻度と満足度
- SNS利用率と商品の知名度
- 音声メディアの利用頻度と通勤の所要時間
クロス集計のメリット・デメリット
クロス集計のメリットとデメリットは何でしょうか?
クロス集計のメリット
- 表計算ソフトで簡単に作成することができる
- 結果が分かりやすく可視化されやすい
- 少ない集計回数でさまざまな視点が持てる
クロス集計表は、基本的なものであれば表計算ソフトのピボットテーブル機能を使えば誰でも簡単に作成できるのが大きな魅力です。
集計結果をグラフ化するのにも使いやすく、視覚的に項目の関係を把握することにも優れています。
クロス集計のデメリット
- 膨大なデータは分析コストが高い
- カテゴリーごとのサンプル数が一定数必要
クロス集計は基本的なものであれば表計算ソフトで作成できますが、多量であったり、複雑な掛け合わせであったりするクロス集計表の作成をするには不向きです。
多量・複雑な分析をしたい場合は、統計ソフトや専門知識が必要になることがあります。
クロス集計は属性や回答で切り分けて分析を行うので、どうしても各カテゴリーごとの度数が少なくなってしまい、統計的な偏りが生まれる可能性が高くなります。度数が30未満になると参考値として扱うため、検証したいカテゴリーの度数が分析出来るようにあらかじめ設計しておく必要があります。
ただし、信頼性の高い調査をしたいからとむやみにサンプルサイズを大きくするとその分だけコストも増えてしまい、本末転倒になっていまいます。
まずは調査前に仮説を立てて、「それを知るためにどんな情報が必要か?」「どんな分析や分析軸が必要になるのか?」をあらかじめ考えておき、サンプルサイズや調査の設計を行うことがクロス集計では肝要です。
クロス集計表データの作成手順【5ステップで完成】
クロス集計表の作成手順について見ていきます。
Googleスプレッドシートでの解説になりますが、Excelでも基本的に変わりありません。
手順1:クロス集計したいデータを用意する
まずはクロス集計したいデータを用意しましょう。
今回は「リモートワークによる化粧の頻度の変化」に関する母数500人のアンケートデータを例とします。
手順2:メニュー欄のデータから「ピボットテーブル」を選択する
メニュー欄にあるデータを選択し、「ピボットテーブル」を選択してください。
手順3:反映させたいデータの範囲を選択する
ピボットテーブルを選択すると、反映させるデータの範囲の選択画面に移ります。
ここで反映させたいデータの範囲を入力し、作成ボタンをクリックしてください。
手順4:右側のエディタから列・行・値を選択する
作成ボタンを押したら、ピボットテーブル作成シートに切り替わります。
右側にあるピボットテーブルエディタ内の「行・列・値」に追加欄から候補を選択してください。
手順5:完成
値まで追加すると、クロス集計表が完成します。
まとめ
アンケート調査やネットリサーチでよく用いられる、クロス集計について解説しました。
表計算ソフトのピボットテーブル機能を使えば誰でも簡単にできてしまうクロス集計ですが、調査企画の段階で、あらかじめ分析計画を立てておき、コスト面とのバランスをとることが活用のコツです。
- サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
-
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
- スピーディーにアンケートデータを収集するには
- お客様ご自身で好きな時にアンケートを実施する方法
- どこの誰にどれくらいリーチができるか
ぜひこの機会にお求めください。 - 資料請求する