多段抽出法とは?メリット・デメリット・具体例を解説
2023年01月13日
多段抽出法は、サンプリング調査の一種です。
具体的には、サンプルを抽出する際に、1つの母集団を複数の小集団にわけて、その小集団からランダムに選ぶプロセスを、複数の段階に分けて実施します。
例えば、第1段階で都道府県、第2段階で市町村などのように、対象となるサンプルを少しずつ狭めます。
多段抽出法を用いることで、対象全てを調査する悉皆調査(全数調査)よりも調査員の移動距離を減らして信頼性の高い調査を行えます。そのため、多段抽出法は全国などの広い範囲で標本調査を行いたい場合によく用いられています。
この記事では、多段抽出法の意味やメリット・デメリットを解説します。あわせて、全国調査に多段抽出法を活用している具体例を解説します。
多段抽出法は「複数段階でサンプリングする」方法
- 多段抽出法
- サンプルを抽出する際に、1つの母集団を複数の小集団にわけて、その小集団からランダムに選ぶプロセスを、複数の段階に分けて実施する方法。
多段抽出方法は、サンプリング調査の一種です。
サンプリング調査とは、調査対象全てでなく、一部のみピックアップして調査する方法です。悉皆調査(全数調査)よりも手間がかからず、全体の傾向までは知る必要がない場合などに適しています。
例えば、全国調査であれば、全国からいきなりサンプルとなる住民を抽出するのではなく、1段階目:全国→2段階目:市町村→3段階目:地区と絞り込んでからサンプリングします。
なお、サンプリングを行う方法には、他にも以下のようなものがあります。
単純無作為抽出法 | 内容 | 完全にランダムにサンプルを抽出する方法 |
---|---|---|
特徴 | 最も基本的なサンプリング方法 | |
注意点 | 母集団が大きいと手間がかかりすぎて実施が困難 | |
系統抽出法 | 内容 | サンプルに通し番号をつけ、最初以外は一定間隔でサンプリング |
特徴 | 単純無作為抽出法よりサンプリングの手間を提言 | |
注意点 | 通し番号の並びに法則性があると、サンプルに偏りが生じる恐れ | |
層化無作為抽出法 | 内容 | 母集団をいくつかグループ分けし、各グループからサンプリング |
特徴 | 母集団内情報を比較(年齢、性別など)可能 | |
注意点 | 母地域特性は反映不可能 | |
クラスター抽出法 | 内容 | 母集団をいくつかのクラスターにわけ、ランダムに選択したクラスターにて全数調査 |
特徴 | 選んだクラスターだけの調査でよい分、調査の手間を低減 | |
注意点 | サンプルに偏りが生じる恐れ |
▼関連記事
悉皆調査の意味とは?標本調査との違いやメリット・デメリットを解説! | リサーチコラム
多段抽出法のメリット・デメリット
多段抽出法は、公的機関や報道機関が、全国規模の大規模な世論調査を行う際などに用いられている手法です。本章では、多段抽出法のメリット・デメリットをそれぞれ解説します。
メリット|訪問調査の手間を抑えられる
多段抽出法のメリットは、訪問調査の手間やコストを抑えられることです。
多段抽出法ではサンプルとなる対象者の居住地域を、都道府県・市町村などの単位で絞り込みます。全国から完全にランダムでサンプルを選ぶことに比べ、訪問する範囲を限定できます。結果として調査員の移動距離を短縮できるため、調査員のコストを抑えやすいのです。
そのため多段抽出法は、特に全国調査など広い範囲での調査でよく用いられます。
▼関連記事
サンプリングとは?統計調査での活用法や種類、注意点を解説 | リサーチコラム
デメリット|誤差が大きくなりがち
多段抽出法のデメリットは、誤差が大きくなりがちであることです。
第1段の無作為抽出にて調査対象にならなかった地域は、多段抽出法で調査対象にならないため、地域ごとの特色があった場合にその特色も調査結果に反映されてしまいます。
なお、誤差を抑えるには、調査対象の人数に応じてサンプルサイズを決定する「確率比例抽出」などが有効です。確定比例抽出とは、各抽出単位とその確率を調整することで、実態に近い比率のサンプルを得る方法です。
例えば、下に確率比例抽出の例を示しています。
抽出後も「うどんが好きな人:そばが好きな人=7:5」の割合は等しくなっています。これが、確率比例抽出の考え方です。
多段抽出法を活用している2つの例
多段抽出法は、国や報道機関など、信頼性の高い団体の調査でも採用される方法です。多段抽出法を活用している具体例として、以下に2つの例を解説します。
多段抽出法の具体例を知ることで、多段抽出法の意味や用途をより深く理解できるでしょう。
総務省統計局の家計調査
総務省統計局の家計調査では、以下のとおり3段階の多段抽出法を採用しています。
1.全国→市町村
全国から市町村を抽出する際には、以下の方法で無作為抽出を行います。
都道府県庁所在市及び政令指定都市 | 各市を1層とし、52層に分割 |
上記除く人口5万以上の市 | 直近の国勢調査結果に基づき、74層に分割 |
人口5万未満の市及び町村 | 計42層に分割 |
以上、52+74+42=168層の各層から、1市町村ずつ標本となる市町村を抽出するのです。
2.市町村→単位区
1.で抽出された市町村について、昨今の国勢調査調査区をベースにして、2調査区ずつまとめて単位区にします。
3.単位区→世帯
2.で抽出された単位区について、調査員1人で2単位区を担当し、各単位区に存在する全ての世帯名簿を作成します。
その名簿から、以下のとおりサンプルを無作為抽出します。
単身世帯 | 交互の単位区より、1世帯を無作為抽出 |
複数人の世帯 | 各単位区の調査対象世帯より、6世帯を抽出 |
▼関連記事
家計調査の概要(総務省統計局)
NHKの世論調査
NHKの世論調査でも、多段抽出法として以下のとおり2段抽出法を採用しています。
1.全国→調査地点
第1段階では、以下の流れで調査地点を抽出します。
1 | 全国を、「北海道」〜「沖縄」の計13ブロックに分割 |
---|---|
2 | 各ブロック内にて、都市規模と産業別就業人口構成比に基づき市区町村を並べ替え |
3 | 各ブロックにて、人口数と抽出地点数を比例させて、計300地点を標本として抽出 |
2.調査地点→調査対象者
第2段階では、調査地点となった市区町村の住民基本台帳を参照し、1地点あたり12人の調査対象者を等間隔抽出します。
統計理論にのっとり調査対象者を抽出しているため、回答結果の誤差範囲は推定可能なのです。
例えば、3,600人を対象とした調査で90%の対象者から回答を得られた場合、その誤差は±1.0%であるとしています。
まとめ|多段抽出法は大規模な調査を行う際に有用
多段抽出法は標本調査方法の1つで、複数段階でサンプリングするものです。
抽出時に都道府県や市町村などの単位を絞り込むことで、調査員の訪問範囲を限定し、移動の手間とコストを減らせます。
一方、第1段の抽出で選ばれなかった地域は考慮されないので、誤差が大きくなりがちであるデメリットもあります。
ただ、国や報道機関など信頼性の高い団体の全国調査にも活用される方法なので、全国規模など大規模な調査には、十分有用なサンプリング方法と言えるでしょう。
- サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
-
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
- スピーディーにアンケートデータを収集するには
- お客様ご自身で好きな時にアンケートを実施する方法
- どこの誰にどれくらいリーチができるか
ぜひこの機会にお求めください。 - 資料請求する