トップページ教育小ネタ帳>算数・数学の世界 「標本調査ってなんだ?」
公開日:2025年10月03日  
更新日:2025年08月21日

算数・数学の世界 「標本調査ってなんだ?」

昨今の目覚ましい情報技術の発展によって、数量的な裏付けのある統計の社会的ニーズは、ますます高まっています。重要な手法である標本調査では、全体の一部だけを調べることで、全体の性質や傾向などを推定することができます。この推定には、算数や数学で学ぶ割合や確率の基本的な考え方を利用しています。

この記事では、簡単な割合や確率の計算を用いて、標本調査とその考え方を使った問題を紹介しています。

全数調査と標本調査

私たちの身の回りでは、いろいろな調査が行われています。ある集団(母集団)を調べるとき、一番正確なデータを取得できるのは、その集団全部を調べる方法です。これを全数調査といいます。

例えば、日本に住んでいるすべての人及び世帯を対象として5年に一度行われる国勢調査や、すべての志願者についてその成績を調査し合格・不合格を判断する学校の入学試験は、全数調査です。全数調査は、誤差なく正確な結果が得られる反面、膨大な時間と費用がかかるという欠点があります。

しかし、全数調査が不適切な場面もあります。例えば、電球の耐久時間の検査では、調査を行った電球は商品にできないので、全数調査を行うことは不可能です。また、時の政権が国民からどのくらい支持を得ているかを示す指標である内閣支持率の調査は、ほぼ毎月、世論調査で有権者の意識の変化を調べて行いますが、このように短期間で情報が変わる内容を調べるには、時間と費用のかかる全数調査は不都合です。そこで、調べたい集団のある一部(標本)を集めて調査し、その集団全体の性質を推定する方法をとります。このような調査を標本調査といいます。

標本調査をするとき、調査の対象となる集団全体を母集団といい、母集団の一部分として取り出した資料を標本といいます。また、標本として取り出した資料の個数を標本の大きさといいます。調査の対象となる標本を偏りがないように集めることができれば、標本調査の結果と全数調査の結果が大きく異なることはありません。標本を公平に集めるためには、それぞれの標本を公平な確率で選ぶ必要があります。標本を偏りのない方法で選び出すことを、無作為むさくい抽出ちゅうしゅつするといいます。

標本調査の種類

無作為抽出法

母集団から標本を抽出するときに確率を用いる抽出方法を、無作為抽出法といいます。無作為抽出法では、母集団のすべてのメンバーが等しい確率で選ばれる可能性があります。これは主に、量的調査で標本から母集団の特性をより正確に推測する際に使用されます。
以下に、無作為抽出の代表的な方法を紹介します。

単純抽出

単純抽出では、母集団の中から等しい確率で標本が選ばれます。標本を偏りがないように集めるためには、はじめに母集団のすべてのメンバーのリストを用意し、そのリスト全体から無作為に一定数、抽出する必要があります。この方法による無作為な抽出の実施には、くじ引きや乱数表、乱数さい(正二十面体のサイコロで、各面に0から9までの数字が2回ずつ書き込まれているもの)などを使用します。

例えば、ある中学校の生徒総数が1000人であり、全員に対して単純抽出を行い100の標本を集める場合、すべての生徒に1から1000までの番号を割り当て、乱数表を使用して100個の番号を選択します。

クラスター抽出

クラスター抽出は、母集団を小集団に分割し、小集団を無作為に選択して、その小集団に対して調査を行います。

例で考えてみましょう。例えば、世帯を対象とした標本調査を行う場合、日本全国の全世帯の中から、調査の対象とする調査区を一定数、無作為抽出法により選び出し、その調査区の中のすべての世帯を調査します。

この方法は、母集団の数が多い、分散した集団を扱うのに適していますが、クラスター間にかなりの差がある可能性があるため、標本に誤差が生じるリスクが高くなることを理解しておく必要があります。例の場合、地域によって居住者の年齢層や所得層が異なる可能性があるので、偏りが生じないように、次に紹介する多段抽出と組み合わせて標本を抽出することもあります。

多段抽出

多段抽出とは、複数の段階を通して標本を抽出する方法です。前に紹介したクラスター抽出で小集団を抽出し、さらにその中で別のカテゴリーに分けて調査対象を抽出します。上記の全国の全世帯を対象とした調査の場合、まず全国の市町村の中から小集団を無作為に抽出し(第一段)、次に、選んだ市町村内で地点を無作為に抽出し(第二段)、さらに、その地点に住む世帯を無作為に抽出する(第三段)というのが、多段抽出の手順です。

複数の段階を経ることで、調査する標本を減らすことができるというメリットがある反面、標本を抽出する方法が複雑化するというデメリットがあります。

層化抽出

層化抽出は、ある母集団が互いに大きく異なるときに使用されます。この抽出方法では、母集団を明らかに異なる点、例えば性別、年齢層、所得層、職務などで小集団に分け、母集団全体の割合に基づいて、各小集団から何人を抽出すべきか計算します。次に、上記にあげたような無作為抽出を使用して、各小集団から標本を選択します。これにより、すべての小集団が適切に反映された抽出になり、より正確な結論を導き出すことができます。

例で考えてみましょう。
ある会社には\(800\)人の女性従業員と\(200\)人の男性従業員がいます。ジェンダー・バランスを確実に反映するように\(100\)人抽出したいとき、母集団をジェンダーに基づいて2つの層に分類し、全従業員数(\(1000\)人)から各小集団の割合を計算します。
この場合、女性従業員の割合は\(800÷1000=0.8\)、男性従業員の割合は\(200÷1000=0.2\)となるので、\(100\)人を抽出するとき、女性従業員からは\(100×0.8=80\) (人)、男性従業員からは\(100×0.2=20\) (人)を抽出すれば良いことがわかります。この比率に基づいて、それぞれの小集団に対して無作為抽出を行い、女性\(80\)人と男性\(20\)人を選び、\(100\)人を抽出します。

有意抽出法

有意抽出法では、無作為でない基準に基づいて個人が選ばれ、すべての個人に等しく選ばれる可能性があるわけではありません。インタビューなどの質的調査でよく用いられます。より少ない標本数で調査が可能である一方、標本の選び方に客観性がなく、標本から母集団の特性を推測する際、無作為抽出法と比べて正確性に劣る可能性があります。
以下に、有意抽出の代表的な方法を紹介します。

割当法(クォータサンプリング)

標本を抽出する際、性別や年代などの属性の組み合わせが母集団と等しくなるように標本を集める方法を、割当法(クォータサンプリング)といいます。標本抽出の時間を節約することができる一方、基にした特徴以外の部分が母集団の縮図となっていることは保証されないので、標本に偏りが生じる可能性や、標本が母集団を代表しない可能性があります。

例えば、ある中学校の生徒全員から\(30\)人を抽出して調査するために、母集団である中学校の全生徒の性別・学年の割合と同じになるように分けた各小集団において、協力を申し出てくれた人から順番に目標の\(30\)人になるまで調査することは、割当法の一例であると言えます。

典型法

母集団の中で平均的、典型的だと思われる調査対象を標本とする方法を、典型法と言います。対象者ができるだけ全体を代表するような条件を設定しますが、「平均的」「典型的」の基準が調査者の主観に委ねられてしまう部分が、この方法の欠点としてあげられます。特定の現象に関する詳細な知識を得たい場合や、母集団が非常に小さく特殊な場合など、質的調査でよく用いられます。

例えば、障がいのある学生の意見や経験についてもっと知りたい場合に、学校生活での経験について多様なデータを収集するために、意図的に異なるサポートを必要とする学生を何人か選ぶことは、典型法の一例であると言えます。

機縁法/縁故法

友人・知人などを標本にする方法を、機縁法/縁故法といいます。特に、友人・知人に調査対象者を紹介してもらい、さらにそこから人づてに多数の標本を集めていく方法を、雪だるま法(スノーボール法)といいます。調査したい母集団を見つけるのが難しい、複雑な条件あるいは限定的な条件の標本を集める場合に使われます。

例えば、日本に住む外国にルーツのある中学生を調査したい際に、対象となり得る一人と知り合い、そのつてをたどって同じような境遇の人を抽出していく方法は、機縁法/縁故法の一例であると言えます。

概数

概数とは

概数(がいすう)とは、およその数のことです。

算数や数学の問題では、正確な数で計算する必要があります。また日常生活においても、買い物の支払い金額などを計算するときには、正確な数で計算しなければなりません。しかし、目的によっては、概数でも十分な場合や、概数の方が適していることもあります。次の問題を考えてみましょう。

次の表は、AとBの2つの畑で、作物を3日間収穫したときの、収穫物の重さをまとめたものです。合計の収穫量が多いのは、どちらの畑でしょうか。

1日目2日目3日目
畑A10.098 kg11.017 kg11.044 kg
畑B11.928 kg12.161 kg9.959 kg

それぞれの畑の、収穫量の合計を正確に計算すれば、収穫量が多いのはどちらの畑なのかわかります。しかし、この小数のたし算を暗算で行うのは少し難しいですね。そこで、概数を使って計算してみましょう。

畑Aの収穫量を、1日目がおよそ\(10\)kg、2日目と3日目がおよそ\(11\)kgとすると、\(10+11+11=32\)(kg)なので、畑Aの収穫量はおよそ\(32\)kg。
畑Bの収穫量を、1日目と2日目がおよそ\(12\)kg、3日目がおよそ\(10\)kgとすると、\(12+12+10=34\)(kg)なので、畑Bの収穫量はおよそ\(34\)kg。
よって、概数を使った計算によって、畑Bの収穫量の方が多いことがわかります。

標本調査と概数

標本調査の結果は概数です。どうして概数なのか、次の標本調査の例を通して考えてみましょう。

 全部で\(1\)万本のくじがあります。
 くじ全体から\(100\)本のくじを単純抽出して調べると、\(13\)本の当たりが含まれていました。
 この標本調査から、\(1\)万本のくじの中の当たりの本数は何本あるかわかりますか。

\(100\)本の中に\(13\)本の当たりが含まれていたので、この標本では当たりの確率が\(13\)%だとわかります。このとき、この調査の結果から、母集団も同じくらいの確率で当たると考えることができます。すなわち、くじ全体には約\(13\)%、およそ\(1300\)本の当たりが含まれていると考えることができます。

しかし、当たりが\(1300\)本ぴったりかどうかは、標本調査だけではわかりません。実際には\(1301\)本の当たりくじが含まれているかもしれませんが、それを確かめるには、全部のくじを確かめる全数調査が必要です。このように、標本調査の結果には誤差があるため、標本調査の結果からは概数しか知ることができないのです。

概数の求め方・表し方

概数を求めるときは、主に四捨五入を使います。しかし、一口に四捨五入した概数といっても、どの数字を四捨五入するかによって概数は変わります。この四捨五入する場所を表す表現はいくつかあります。ここでは、5通りの表現を確認しておきます。

(1a) ~の位で四捨五入した概数
この表現は、四捨五入する数字のある位を指定しています。
\(12385\)を百の位で四捨五入した概数は、およそ\(12000\)です。百の位で四捨五入するので、「\(3\)」を四捨五入することになります。

(1b) 上から~桁で四捨五入した概数
この表現は、四捨五入する数字のある位を、上から数えた桁で指定しています。
\(12385\)を上から4桁で四捨五入した概数は、およそ\(12400\)です。上から4桁目は十の位なので、十の位で四捨五入した概数になります。

(2a) ~の位までの概数
私たちの数字の書き方は、10をひとつのまとまりと考えて、その位にそのまとまりがいくつあるかを表していました。そして、~の位までの概数とは、その位までのまとまりがおよそ何個あるかを考えた概数です。
つまり、\(12385\)とは、万が\(1\)つ、千が\(2\)つ、百が\(3\)つ、十が\(8\)つ、一が\(5\)つあることを表しています。そして、\(12385\)の百の位までの概数は、万が\(1\)つ、千が\(2\)つで、百が\(3.85\)個つまりおよそ\(4\)つあるので、およそ\(12400\)です。
つまり、~の位までの概数とは、~の位の1つ下の位で四捨五入した概数になります。

(2b) 上から~桁の概数
上から~桁の概数とは、上から~桁目の位までの概数のことです。
\(12385\)の上から4桁の概数は、およそ\(12490\)です。\(12385\)の上から4桁目は十の位なので、十の位までの概数と同じです。

(3) ~の単位で求めましょう。
この表現には、概数とは書かれていないので、そうと知らなければ、概数を表す表現だと思わないかもしれません。
これは、求める数字が概数となることを前提とした問い方です。
単位とは、何かを測るときの基準となるまとまりのことを指します。なので、例えば「百の単位で求めましょう。」というのは、「百のまとまりを基準として考えて、概数にしましょう。」という意味になります。
およそ\(12385\)を百の単位で求めると、百のまとまりがおよそ\(123.85\)個あると考えることができます。これは百のまとまりがおよそ\(124\)個あると言えるので、およそ\(12385\)を百の単位で求めると、およそ\(12400\)です。

問題に挑戦!

1. 同じ大きさのビー玉がたくさん入っている箱の中からビー玉を\(40\)個取り出し、目印をつけてから箱の中に戻します。ビー玉をよくかき混ぜてから\(35\)個取り出したところ、その中に目印のついたビー玉が\(6\)個入っていました。このとき、次の問いに答えましょう。
(1) 標本の大きさは、いくらですか。
(2) 箱の中には、およそ何個のビー玉が入っていると考えられますか。\(10\)個単位で答えてください。

2. 次の調査は、全数調査と標本調査のどちらで行うと良いですか。
(1) ある高校の入学試験
(2) 学校で行う健康診断
(3) 選挙の当選予想調査
(4) 全国の中学3年生の通塾率調査

3. ある世論調査において内閣支持率が\(25\)%であるとき、全国の有権者のうち内閣を支持している人は、およそ何人であると考えられますか。全国の有権者数を\(1\)億\(600\)万人として、\(100\)万人単位で答えましょう。

4. 袋の中に黒と白の碁石が合わせて\(250\)個入っています。これらをよくかき混ぜてから\(30\)個取り出したところ、\(13\)個が黒石でした。
(1) 標本の大きさは、いくらですか。
(2) 袋の中には、およそ何個の黒石が入っていると考えられますか。\(10\)個単位で答えてください。

5. ある中学校の3年生は、男子の人数が\(120\)人です。この\(120\)人の平均身長を求めるために、\(20\)人を選んで標本調査を行います。次のうち、最も適切な選び方はどれでしょう。
A. \(120\)人を1列に並ばせて、背の高い方から\(20\)人を選ぶ
B. 運動部に入っている人を\(20\)人選ぶ
C. 当たりくじを\(20\)本、空くじを\(100\)本用意し、くじを引いてもらって当たりの人を選ぶ

6. ある市の全世帯数は\(50000\)世帯です。このうち\(3000\)世帯を無作為に抽出し、使用している動画配信サービスを調べたところ、次のような調査結果が出ました。

AサービスBサービスCサービスその他
1150世帯930世帯660世帯260世帯合計3000世帯

この市では、Aサービスを利用している世帯数は、何世帯くらいと考えられますか。次から選びましょう。
A. \(13000\)世帯
B. \(17000\)世帯
C. \(19000\)世帯
D. \(21000\)世帯

7. ある養魚場で、池にいる魚の数を調べるために\(240\)匹の魚を捕獲し、その全部に印をつ けて池に戻しました。次の日ふたたび魚を捕獲したところ、捕獲した魚は\(380\)匹で、そのうち\(17\)匹に印がついていました。この池にいる魚は、およそ何匹と考えられますか。\(10\)匹単位で答えましょう。

解答

1. (1)\( 35\) (2) 約\(230\)個
(1) 箱の中のビー玉が母集団で、2度目に取り出したビー玉が標本なので、その大きさは\( 35\)です。
(2) 標本における目印のついたビー玉の確率は\(\frac{6}{35}\)なので、母集団における確率も同じであると考えます。よって、\(\frac{40}{箱の中のビー玉}=\frac{6}{35}\)より、\(40\div\frac{6}{35}=233.333…\) (個)
【別解】\(40:箱の中のビー玉=6:35\)と考えて、比例式を使って考えることもできます。

2. (1) 全数調査 (2) 全数調査 (3) 標本調査 (4) 標本調査

3. 約\(2700\)万人
\(25%\)は\(\frac{25}{100}=0.25\)なので、全有権者数に\(0.25\)をかけると、求める数がわかります。
\(10600(万人)\times0.25=2650\)(万人)
\(100\)万人単位で答えるので、\(10\)万の位で四捨五入して、答えは約\(2700\)万人です。

4. (1) \(30\) (2) 約\(110\)個
(1) 袋の中の碁石が母集団で、取り出した碁石が標本なので、その大きさは\(30\)です。
(2) 標本における黒石の確率は\(\frac{13}{30}\)なので、母集団における確率も同じであると考えます。よって、すべての\(碁石×\frac{13}{30}\)より、\(250\times\frac{13}{30}=108.3…\) (個)

5. C
A,Bは全員が等しい確率で選ばれる可能性があるわけではないので有意抽出、Cは\(120\)人全員が等しい確率で選ばれる可能性があるので無作為抽出です。有意抽出より無作為抽出の方が、母集団の特性をより正確に反映します。

6. C
調査した3000世帯が標本です。標本におけるAサービスを利用している確率は\(\frac{1150}{3000}\)なので、母集団における確率も同じであると考えます。ある市の全世帯50000世帯にAサービスを利用している確率\(\frac{1150}{3000}\)をかけると、求める数がわかります。
\(50000\times\frac{1150}{3000}=19166.66…\) (世帯)

7. 約\(5360\)匹
次の日に捕獲した\(380\)匹の魚が標本です。標本における印のついている魚の確率は\(\frac{17}{380}\)なので、母集団における確率も同じであると考えます。よって、\(\frac{240}{池にいる魚}=\frac{17}{380}\)より、\(240\div\frac{17}{380}=5364.705…\)(匹)





\ SNSでシェアしよう /

このメディアについて

これからの教育を担う若い先生たちに向けた、
学び・教育に関する助言・ヒント(tips)となるような情報を発信します。
何気なく口にする駄菓子(chips)のように、
気軽に毎日読んでもらいたいメディアを目指しています。