サンプルサイズの決め方 – アンケート調査で何人分の回答を集めれば良い?

アンケート調査やネットリサーチを実施するとき、いったい何人分の回答を集めれば良いのでしょうか?
リサーチに慣れていない方は疑問に思うでしょう。ここでは、回収するサンプルの数(サンプルサイズ)の決め方をご紹介します。

■基本的な考え方
サンプルサイズを決めるにはまず、どの程度の正確性が必要か?の定義が必要となります。

・正確性とは何か?
正確性とは「そのアンケート調査がどの程度の誤差を許容できるものなのか?」ということです。
例えば、「日本全国20代以上の既婚女性」を対象としたアンケートを実施することを想定しましょう。
もちろんですがアンケートを「日本全国20代以上の既婚女性」全員に実施することはできません(もし実施するとしても非常に困難ですね)。
ですから、「日本全国20代以上の既婚女性」のような、
A. ターゲットとなる人全体(母集団)
→アンケートを取りたい全ての対象者
を想定しつつ、
B. アンケート回答者としてピックアップ(サンプリング)した人たち
→実際にアンケートを実施する人たち
に対してアンケートを実施することになります。

この時に、仮にAにアンケートを実施した結果と(実際は無理ですが)、実際のBのアンケート結果の回答データのズレ(これを標本誤差と言います)を、どの程度許せるかということです。

・回答データのズレ(標本誤差)はどのように発生する?
例えば、前述の「日本全国20代以上の既婚女性」を対象としたアンケートを想定した場合、ある質問にa, b, cの3つの選択肢があったとします。
この時に偶然「B. アンケート回答者としてピックアップ(サンプリング)した人たち」の中に偏りがあり、aと答える人の割合が多かった場合に回答データのズレ(標本誤差)が発生することになります。

・回答データのズレ(標本誤差)の標準値とは
アンケート調査の目的・都合にもよりますが、一般的な調査では許容誤差を「±5%」としていることが多いようです。
一般的にアンケート結果を見る場合は、±5%は誤差がある可能性があると思って見るのが良いということですね。

・標本誤差が許容範囲内に収まるようにするには(信頼水準)
次に「どの程度の割合で、標本誤差が許容範囲内に収まるようにするか?(信頼水準)」という点を考えます。
こちらも場合によりけりですが、通常は「95%」とすることが多いようです。これは「100回サンプリングしたら、そのうち95回は標本誤差が許容範囲内(例 ±5%)に収まる」という意味です。

■サンプルサイズの算出式
上述の許容誤差や信頼水準の値などが決まっていれば、以下の計算式でサンプルサイズを算出できます。
少し難しい式に見えますが、想定する数値を入れていけば答えは出てきます。

n:標本数
調査対象者の数です。
p:回答比率
支持率や保有率などの調査対象者の回答の比率
d:標本偏差
調査結果で容認できる誤差
λ:信頼水準
正しく判断できる確率

(中略) ここでは、回答比率0.5、標本誤差は5%ポイント、信頼水準95%(λ=1.96)として必要な調査対象者数を計算します。調査に必要な対象者数は、

出典:『なるほど統計学園高等部 | 調査に必要な対象者数』

つまり、信頼水準 λ、 回答比率 p、許容できる誤差 d が決まれば必要なサンプルサイズが算出できる、ということになります。

・「標本数」とは

・「回答比率」とは

・「標本偏差」とは

・「信頼水準」とは

■早見表を使ってサンプルサイズを決める

・サンプルサイズを計算するための早見表
サンプルサイズを考えながら都度計算するのは手間です。実務上は、以下のような早見表を使って適切なサンプルサイズを決めるのが早道でしょう。

・早見表の味方(★)
例えば「信頼水準95%・許容誤差5%」は決め打ちとした上で、サンプルサイズを仮に200にしたとします。
この場合、ある設問の回答比率が15%または85%だったなら、その設問の回答データ値は15%±5%(または85%±5%)、すなわち「10%〜20%(または80%〜90%)の範囲にある」ということになります(※注1)。
サンプルサイズを決めるときには、自身が行うアンケート調査の目的・都合を考慮して必要な精度を考えつつ、早見表で誤差を確認して数を調整・決定することになります。

※注1「回答比率」のパーセンテージを予め決められないときはどうすれば良いのでしょうか?その場合、回答比率=50%としておけば、最大限精度を高めることができます。ただし、その分必要なサンプルサイズが大きくなり、調査料金も上がる点に留意する必要があります。

■実際にアンケート調査を実施する場合に重要なこと
これまで、確からしいアンケート調査結果を得るためには、という視点で解説してきましたが、実際にはアンケート調査を実施する場合は正確性と費用を天秤にかけ良い頃合いを見極めることが必要になります。

・アンケート調査の費用はどう決まるか?
ずばり、ネットリサーチの料金は主に設問数とサンプルサイズで決まります。
調査データの誤差を抑えようとすれば必要なサンプルサイズが大きくなり、サンプルサイズが大きくなればなる程、調査費用も高くなっていきます。

上述のサンプルサイズの計算式によれば、回収サンプルの数 n は許容する標本誤差 d の二乗に反比例します。つまり、調査データの誤差を半分にするには、サンプルサイズを4倍にする必要があるということです。 サンプルサイズが4倍になった場合、どの程度料金が変わるのでしょうか?例えば30問の調査をネットリサーチで実施する場合を考えてみます。

・サンプルサイズが「100サンプル」の場合
30問×100サンプルの料金は下記のようになることが多いでしょう。
価格帯:110,000円〜268,000円
平均:約182,500円

・サンプルサイズが「400サンプル」の場合
価格帯:210,000円〜424,000円
平均:約326,400円

この例では、100サンプルを400サンプルにすることで調査コストがおよそ2倍になりました。
アンケート調査実施に際して、通常は予算に限りがあると思います。したがって現実的には、サンプルサイズをいくつにするのかは「調査結果の精度・信頼性」だけでなく、「調査費用」とのバランスも考えて決めることになるでしょう。

■正確性とアンケート収集費用の兼ね合い
上記の例は単純に集計する場合を考えてきましたが、クロス集計をする場合などはより多くのサンプルが必要になります。
なかなか素人では決めずらい範疇の話となりますので、こういったことはリサーチ会社に御見積と共に相談するのが一番です。
その際に

・正確性が高いアンケートを実施したい場合
例えば、
・論文に掲載するような調査
・ビジネス等で大きな判断を行うための調査
・その調査によって他の調査の内容が決まるような大元のベース調査
のようなものであれば、費用はかかったとしても正確性を優先するべきです。

・正確性がそこそこでも良いアンケートを実施したい場合
例えば、
・アンケートの調査結果を元に、その傾向をWeb上の記事を作成する
・ビジネス等で、大雑把なユーザーの傾向を見たい場合
・アイデアを出すための議論のネタとなるような資料
のようなものであれば、費用を抑えて収集し、いろんな条件でたくさんのアンケートを実施する方が良いでしょう。

■リサーチ会社に相談する前に確認しておきたいこと
上記の費用を決定していくためにも、リサーチ会社に相談する前に決定しておくと良いことのリストです。

1. アンケートの用途
用途によって必要な正確性や、予算の上限も決まってきますので、定義しておくことが重要です。
大抵の場合は決まっていると思いますが、場合のよっては2種類の用途に使う場合などもありますので、きちんと説明できるようにしておきましょう。

2. アンケートの目的
正確性と予算の兼ね合いを考える上で最も重要となりますので、アンケートの目的は決めておきましょう。
「あれば使えるかもしれない」というような曖昧な目的ではなく、
・このタイミングで
・こういう人たちに
・こういうことを判断してもらう
ために収集する、という具体的なことが決定していた方が良いです。

3. アンケートの内容(案)
実際に収集する前に、リサーチ会社の方で添削などは行うことが多いですが、それにしても案が無いと修正もできませんのでざっくりとした案があると話が進みやすいと思われます。
ただし、案を作成する段階で悩んでしまって時間がかかるようであれば用途と目的をリサーチ会社に伝えることでこれまでの経験からサポートしてもらえることもあるでしょう。
また、ネット上に同様のアンケートがある場合もありますので、そのアンケートをベースに修正していくことも効率が良いですね。

4. 概算費用
費用は上記の通りアンケート集計結果の正確性によっても変わってきますが、大枠は持っておいた方が良いでしょう。
予算に合わせて、設問を減らしたり、サンプルを減らしたりして調整をかけていくことになりますので、概算のベース予算があった方が考えやすいと思います。