母平均の検定(母分散未知)

大学・一般数学統計大学・一般数学

統計分野・検定の第1弾。まずは、標本平均が母集団の平均と同じとみなしてよいかを判断する母平均の検定です。その中でも母集団の分散がわからないという条件の下、検定を行います。
①検定の方法
②例



目次
  • 1. ①検定の方法
  • 2. ②例

①検定の方法

一般的に、母平均の検定と言うとこの方法になります。標本のみのデータから標本分散と標本平均を算出し、標本平均が母平均と同じと言ってよいかを検定で確かめます。

母分散が未知の場合の母平均の検定<

\(~n~\) 個の標本 \(~X_{1},X_{2},\cdots,X_{n}~\) が母集団の平均\( \mu~\) と同じかどうかを検定する。

 
(1)標本平均 \(~\overline{X}~\) と、標本分散 \(~s^2~\) 、自由度 \(~\nu~\) を算出する。

\begin{align}
\overline{X}&=\displaystyle \frac{X_{1}+X_{2}+\cdots+X_{n}}{n} \\
\\
s^2&=\displaystyle \frac{(X_{1}-\overline{X})^2+(X_{2}-\overline{X})^2+\cdots+(X_{n}-\overline{X})^2}{n} \\
\\
\nu&=n-1 \\
\end{align}


\begin{align}
\overline{X}&=\displaystyle \frac{X_{1}+X_{2}+\cdots+X_{n}}{n} \\
\\
s^2&=\displaystyle \frac{(X_{1}-\overline{X})^2+\cdots+(X_{n}-\overline{X})^2}{n} \\
\\
\nu&=n-1 \\
\end{align}

 ※Excelを用いて、標本平均 \(~\overline{X}~\) は「AVERAGE\((X_{1},X_{2},\cdots,X_{n})\)」で、標本分散 \(~s^2~\) は「VARP\((X_{1},X_{2},\cdots,X_{n})\)」で求められる。

 

(2)帰無仮説と対立仮説を立てる。
  帰無仮説 \(~H_{0}~\) :母平均 \(~\mu ~\) と標本平均 \(~\overline{X}~\) が一致する。
  対立仮説 \(~H_{1}~\) :母平均 \(~\mu~\) と標本平均 \(~\overline{X}~\) が一致しない。

 
(3)検定統計量を以下の式で算出する。

\begin{equation}
t=\displaystyle \frac{(\overline{X}-\mu)\sqrt{n}}{s}  (ただし、s=\sqrt{s^2} で標準偏差)
\end{equation}


\begin{align}
t&=\displaystyle \frac{(\overline{X}-\mu)\sqrt{n}}{s}  \\
\\
& (ただし、s=\sqrt{s^2} で標準偏差)
\end{align}

 ※Excelを用いて、標本標準偏差 \(~s~\) は「STDEVP\((X_{1},X_{2},\cdots,X_{n})\)」で求められる。
 

(4)有意水準の値 \(~\alpha~\) と自由度 \(~\nu~\) から、 \(~t~\) 分布表を使って \(~t~\) 値の境界値を求める。
  \(~t~\) 分布表↓↓
  ※有意水準 \(~\alpha~\) は5%が多い。より厳密な検定の場合は1%。
  ※ \(~t~\) 値の境界値はExcelで「T.INV.2T \(~(\alpha , \nu)~\) 」という関数でも求められる。

 

(5) (3)が(4)の境界値を超えている(棄却域に入っている)かどうかを比較する。

※自由度20 のt分布は上図のようになり、有意水準0.05における \(~t~\) 値の境界値は2.09である。
 そのため、 \(~t<-2.09~\) と\(~ 2.09 < t \)が棄却域になる。
 
  ・ \(~t~\) が棄却域に入っていれば帰無仮説 \(~H_{0}~\) は棄却され、
  「対立仮説 \(~H_{1}~\) :母平均 \(~\mu~\) と標本平均 \(~\overline{X}~\) が一致しない」と結論づけられる。

  ・ \(~t~\) が棄却域に入っていなければ帰無仮説 \(~H_{0}~\) は棄却されず、
  「帰無仮説 \(~H_{0}~\) :母平均 \(~\mu ~\) と標本平均 \(~\overline{X}~\) が一致する」と結論づけられる。

 手順を上記のように一般的に表すと、複雑なようですがExcelを使えば計算の手間も省け、簡単に検定ができます。


②例

では、例を通して検定の方法を理解しましょう。

 ある数学の定期テストの平均点は60点であった。全陸上部員10人の点数が下記の表に示されている。陸上部員は学校の中でも点数が高いと言えるか。有意水準5%で調べなさい。

40 50 50 60 70
70 80 80 90 90

パッと見た感じ、平均は60点よりも高いということが言えそうですが・・・。
それを数値的に確かめるのが検定です。
先ほどの手順に従って、計算していきましょう。

解説

(1)標本平均 \(~\overline{X}~\) と、標本分散 \(~s^2~\) 、自由度 \(~\nu~\) の算出

\begin{align}
\overline{X}&=\displaystyle \frac{40+50+\cdots+90}{10} \\
\\
&=\frac{680}{10} \\
\\
&=68
\\
\\
s^2&=\displaystyle \frac{(40-68)^2+(50-68)^2+\cdots+(90-68)^2}{10} \\
\\
&=\frac{(-28)^2+(-18)^2+\cdots+22^2}{10} \\
\\
&=\frac{2760}{10} \\
\\
&=276
\\
\\
\nu&=10-1 \\
&=9
\end{align}


\begin{align}
\overline{X}&=\displaystyle \frac{40+50+\cdots+90}{10} \\
\\
&=\frac{680}{10} \\
\\
&=68
\\
\\
s^2&=\displaystyle \frac{(40-68)^2+\cdots+(90-68)^2}{10} \\
\\
&=\frac{(-28)^2+\cdots+22^2}{10} \\
\\
&=\frac{2760}{10} \\
\\
&=276
\\
\\
\nu&=10-1 \\
&=9
\end{align}

(2)帰無仮説と対立仮説
  帰無仮説 \(~H_{0}~\) :陸上部の平均は学校の平均と差がない
  対立仮説 \(~H_{1}~\) :陸上部の平均は学校の平均と差がある

 

(3)検定統計量の算出
\begin{align}
t&=\displaystyle \frac{(68-60)\sqrt{10}}{\sqrt{276}} \\
\\
&\fallingdotseq 2.47
\end{align}

(4)有意水準の値 \(~\alpha~\) と \(~t~\) 値の境界値
 今回、有意水準 \(~\alpha=0.05~\) 、自由度 \(~\nu=9~\) なので、Excelで、「=T.INV.2T(0.05,9)」と入力すると、 \(~t~\) 値の境界値は2.26とわかります。。

 t分布のグラフ中で表記すると、下図のようになる。

 

(5) (3),(4)の比較
\(~2.47>2.26~\) より、帰無仮説 \(~H_{0}~\) を棄却できる。

 そのため、「対立仮説 \(~H_{1}~\) :陸上部の平均は学校の平均と差がある」が言える。
※実際、平均点が68なので、「陸上部の平均は学校の平均よりも高い」と言える。

慣れないと少々難しいです・・・。


検定は主観からではなく、数値的に物事を判断するため、データから読み取った自分の主張に説得力を持たせることができます。Excelが使えると心強いですね。

   
 
 


☆参考文献等
・「平均値の検定」,<http://www.aoni.waseda.jp/abek/document/t-test.html > 2017年7月16日アクセス
・「統計WEB 24-1.母平均の検定(両側t検定)」,<https://bellcurve.jp/statistics/course/9405.html > 2017年7月18日アクセス
・日本統計学会(2014)『統計検定2級 公式問題集』,pp.25,実務教育出版.