母比率の検定

大学・一般数学統計大学・一般数学

統計分野・検定の第3弾。標本の比率が母集団の比率と等しいかどうかを調べます。
①検定の方法
②例



目次
  • 1. ①検定の方法
  • 2. ②例

①検定の方法

標本数が十分に大きな場合には、標本比率の分布は正規分布に従うことから、母平均の検定と同様に標準正規分布を使うことができます。

母比率の検定

 特定の事象について、 \(~n~\) 個の標本における確率 \(~p~\) と母集団における確率\( p_{0}~\) が同じかどうかを検定する。

 
(1)標本比率 \(~p~\) を算出する。
 

(2)帰無仮説と対立仮説を立てる。
  帰無仮説 \(~H_{0}~\) :母比率 \(~p_{0} ~\) と標本比率 \(~p~\) が一致する。
  対立仮説 \(~H_{1}~\) :母比率 \(~p_{0} ~\) と標本比率 \(~p~\) が一致しない。

 

(3)検定統計量を以下の式で算出する。
\begin{equation}
z=\displaystyle \frac{p-p_{0}}{\sqrt{\frac{p_{0}(1-p_{0})}{n}}}
\end{equation}

 

(4)有意水準の値 \(~\alpha~\) から、標準正規分布表を使って \(~z~\) 値の境界値を求める。
  ※有意水準 \(~\alpha~\) は5%が多い。より厳密な検定の場合は1%。
  ※ \(~z~\) 値の境界値はExcelで「NORM.S.INV\(\left( \displaystyle \frac{\alpha}{2} \right) ~\)」という関数でも求められる。

 

(5) (3)が(4)の境界値を超えている(棄却域に入っている)かどうかを比較する。

※有意水準0.05における、 \(~z~\) 値の境界値は1.96である。
 そのため、 \(~z<-1.96~\) と \(~ 1.96 < z \)が棄却域となる。  
  ・ \(~t~\) が棄却域に入っていれば帰無仮説 \(~H_{0}~\) は棄却され、
  「対立仮説 \(~H_{1}~\) :母比率 \(~p ~\) と標本比率 \(~p_{0}~\) が一致しない。」と結論づけられる。

  ・ \(~t~\) が棄却域に入っていなければ帰無仮説 \(~H_{0}~\) は棄却されず、
  「帰無仮説 \(~H_{0}~\) :母比率 \(~p ~\) と標本比率 \(~p_{0}~\) が一致する。」と結論づけられる。

  \(~z~\) 値の計算で、連分数やルートが出てくるために手計算では面倒です。Excelの使用をオススメします。


②例

では、サイコロの例で検定の仕方を理解していきましょう。

例題

あるサイコロを400回振ったところ、目の出方が以下の通りだった。このサイコロにおいて、3や5の目が出る確率は \(~\displaystyle \frac{1}{6}~\) であると言ってよいか?有意水準0.05で検定しなさい。
 

サイコロの目
出た回数 70 70 50 60 80 70

 「こんなにきれいな数になるか!」というツッコミはさておき、確かに3の出た回数が少なく、5の出た回数が多いです。これらについて、確率が \(~\displaystyle \frac{1}{6}~\) と言えるのかを検定します。

解説

まず、3が出た回数について調べる。

(1)標本比率 \(~p~\) の算出
\begin{equation}
p=\displaystyle \frac{50}{400}=\frac{1}{8}
\end{equation}
 

(2)帰無仮説と対立仮説
  帰無仮説 \(~H_{0}~\) :母比率 \(~\displaystyle \frac{1}{6} ~\) と標本比率 \(~\displaystyle \frac{1}{8}~\) が一致する。

  対立仮説 \(~H_{1}~\) :母比率 \(~\displaystyle \frac{1}{6} ~\) と標本比率 \(~\displaystyle \frac{1}{8}~\) が一致しない。
 

(3)検定統計量の算出
\begin{align}
z&=\displaystyle \frac{\displaystyle \frac{1}{8}-\frac{1}{6}}{\displaystyle \sqrt{\frac{\frac{1}{6}(1-\frac{1}{6})}{400}}} \\
\\
&\fallingdotseq -2.24
\end{align}

 

(4)有意水準の値 \(~\alpha=0.05~\) における \(~z~\) 値の境界値
 Excelで、NORM.S.INV(0.025)と入力すると、約「-1.96」と表示される。標準正規分布中に表すと、以下の図のようになる。

 

(5) (3)が(4)の比較
  \(~-2.24<-1.96~\) より、帰無仮説 \(~H_{0}~\) を棄却できる。
 そのため、「対立仮説 \(~H_{1}~\) :母比率 \(~\displaystyle \frac{1}{6} ~\) と標本比率 \(~\displaystyle \frac{1}{8}~\) が一致しない。」が言える。
※実際、標本比率のほうが小さいので、「このサイコロの3の目は出にくい」と言える。
 


 同様の方法でサイコロの目が5のときについても考えると、
\begin{equation}
p=\displaystyle \frac{80}{400}=\frac{1}{5}
\end{equation}
となるため、
\begin{align}
z&=\displaystyle \frac{\displaystyle \frac{1}{5}-\frac{1}{6}}{\displaystyle \sqrt{\frac{\frac{1}{6}(1-\frac{1}{6})}{400}}} \\
\\
&\fallingdotseq 1.79
\end{align}
となる。有意水準の値 \(~\alpha=0.05~\) における \(~z~\) 値の境界値は、NORM.S.INV(0.025)と入力すると、約「-1.96」と表示されるため、標準正規分布中に表すと、以下の図のようになる。

 図から、 \(~1.79<1.96~\) より、帰無仮説 \(~H_{0}~\) を棄却できない。
 そのため、「帰無仮説 \(~H_{0}~\) :母比率 \(~\displaystyle \frac{1}{6} ~\) と標本比率 \(~\displaystyle \frac{1}{5}~\) が一致する。」が言える。

50回と80回。期待値が67回なので、感覚的には違いが無さそうですが、
統計的にみると50回しか出ていない3の目は出なさすぎ、
80回も出た5の目は許容の範囲内ということが言えました。


今回は母比率の検定でした。街にあるガチャポンの母比率が、全種類同様に確からしいかを調べてみたいです・・・。

   
 
 


☆参考文献等
・「統計WEB 25-1.母比率の検定」,<https://bellcurve.jp/statistics/course/9488.html > 2017年7月19日アクセス
・「to-kei.net 全人類がわかる統計学」,<http://to-kei.net/distribution/normal-distribution/density-function-derivation/ > 2017年7月19日アクセス
・日本統計学会(2014)『統計検定2級 公式問題集』,pp.24,実務教育出版.