数学、ときどき統計、ところによりIT

理論と実践の狭間で漂流する数学趣味人の記録

仮説検定におけるサンプルサイズの決め方

今回は検定を適切に実施するために必要となるサンプルサイズについて考えます。

ここで言う適切な検定とは、第 1 種の誤りと第 2 種の誤りのリスクが想定の範囲に収まるような検定関数により実施される検定を指します。必要となるサンプルサイズは検定ごとに異なるため、全ての検定についてサンプルサ イズを示すことは出来ませんが、サンプルサイズを決めるための方法について、母平均の参照値との一致性に関する両側検定(母分散が既知の場合)を例に見ていきます。

 

定理 (\Omega,\mathcal{F},P) を確率空間、 X_{i}:\Omega\to\mathbf{R}i=1,2,\ldots,n)を母平均 \mu、母分散 \sigma ^2正規分布に従う、互いに独立な確率変数とす る。また \(\varepsilon_{0}>0\), \Theta_{0}=\{\mu_{0}\}, \Theta_{1}=\mathbf{R}\backslash\{\mu_ {0}\}、\(0<\alpha<0.5\)、\(0.5<\beta<1\) とする。統計量

\displaystyle T_{\mu_{0}}(X):=\frac{\sqrt{n}\,(\overline{X}-\mu_{0})}{\sigma},\quad X=(X_{1},\ldots,X_{n})

に関する両側検定\[ \varphi :=1_{T_{\mu_{0}}(X)^{-1}( (-\infty,-t]\cup[t,\infty) )}:\Omega\to \{0,1\} \]を帰無仮説  \mu=\mu_{0} の下で行うとき、サンプルサイズ n を\begin{equation}n > \frac{1}{\varepsilon_{0}^2}  \left( z\left(\frac{\alpha}{2}\right)-z(\beta) \right)^{2} \label {eq:sample_size:z-test}\end{equation}を満たすように取れば*1、棄却限界値 t が\begin{equation}z \left( \frac{\alpha}{2} \right) \le t < z(\beta)+\sqrt{n} \,\varepsilon_{0} \label {eq:sample_size:z-test:critical_val} \end{equation}の範囲にある両側検定 \varphi有意水準\alpha であり、かつ  |\mu_{1}-\mu_{0}| \ge \varepsilon_{0} \sigma を満たす \forall\mu_{1}\in\Theta_{1} に対する検出力 \beta_{\varphi}(\mu_{1})  は \beta よりも大きい。

証明 条件 \eqref{eq:sample_size:z-test} から \eqref{eq:sample_size:z-test:critical_val} を満たす t を取ることが出来る。このとき両側検定 \varphi有意水準\alpha であり、検出力は \beta よりも大きい事を確認する。

有意水準について確認する。帰無仮説 \mu=\mu_{0} の下で T_{\mu_{0}}(X)\sim N(0,1) であるから\[E_{P}[\varphi]=P_{N(0,1)}( (-\infty,-t]\cup[t,\infty) )=2P_{N(0,1)}([t,\infty)).\]これと t\ge z\left(\alpha/2\right) より\[E_{P}[\varphi]\le2P_{N(0,1)}\left(\left[z\left(\frac{\alpha}{2}\right),\infty\right)\right)=\alpha.\]

検出力について確認する。

 \displaystyle T_{\mu_{0}}(X)=\frac{\sqrt{n}\,(\overline{X}-\mu_{1})}{\sigma}+\sqrt{n}\,\varepsilon

(ただし  \varepsilon:=(\mu_{1}-\mu_{0}) / \sigma )と書けることに注意すれば、対立仮説 \mu= \mu_{1} の下で T_{\mu_{0}}(X)\sim N(\sqrt{n}\,\varepsilon,1) であるから\[\beta_{\varphi}(\mu_{1})=E_{P}[\varphi]=P_{N(0,1)}( (-\infty,-t \sqrt{n}\,\varepsilon])+P_{N(0,1)}([t- \sqrt{n}\,\varepsilon,\infty) ).\]

一方、\( t-\sqrt{n}\varepsilon_{0}<z(\beta) \) より \[P_{N(0,1)}([t-\sqrt{n}\varepsilon_{0},\infty))>\beta=P_{N(0,1)}([z(\beta),\infty))\]よって \(\varepsilon>0\) のとき\[\begin{split}\beta & <P_{N(0,1)}([t-\sqrt{n}\,\varepsilon_{0},\infty))\\ & <P_{N(0,1)}([t-\sqrt{n}\,\varepsilon,\infty))<\beta_{\varphi}(\mu_{1}),\end{split}\]

また \(\varepsilon<0\) のとき\[\begin{split}\beta & <P_{N(0,1)}([t-\sqrt{n}\,\varepsilon_{0},\infty))\\
& <P_{N(0,1)}([t-\sqrt{n}\,(-\varepsilon),\infty))\\
& =P_{N(0,1)}((-\infty,-t-\sqrt{n}\,\varepsilon])<\beta_{\varphi}(\mu_{1}).\end{split}\]

(証明終)

 

定理の中に出てくる対立仮説 \mu_{1}\in\Theta_{1} に対する条件  |\mu_{1}-\mu_{0}| \ge \varepsilon_{0} \sigma について、6 面体サイコロにイカサマがあるか否かを判断する問題を例にとり説明します。

この問題に対して検定を利用する場合、設定する帰無仮説は例えば「1の目が出る確率(これを \mu とする)は \mu=1/6」ですが、サイコロを作る際の加工精度や各面のデザインの違いから来る重量のバランス、空気抵抗や摩擦など細かな要因を考慮に入れれば、厳密に \mu=1/6 が成り立つサイコロを作るのは至難の業です。しかしここで行いたいことはイカサマの有無を判断することであって、加工精度やデザイン由来の違いを見たい訳ではありません。そこで \mu が確率 1/6 から近い値を取っている場合は \mu=1/6 と見做すことにします。これを対立仮説側の条件として表現すると  |\mu_{1}-\mu_{0}| \ge \varepsilon_{0} \sigma となります。

 

ところで\eqref{eq:sample_size:z-test} を利用して必要なサンプルサイズを決める際に注意するべきことは、\varepsilon_{0} を分析の対象や目的に応じて分析者が適切に設定しなければならないということです。先程のサイコロの例で言えば、サイコロの加工精度の確認が目的の場合はイカサマ判定の場合にに比べて \varepsilon_{0} を小さく設定する必要があります。

*1:式 \eqref{eq:sample_size:z-test} 中の z(p) は標準正規分布の上側 100 p パーセント点を表す。