統計検定準1級の学習10.検定の基礎と検定法の導出

学術図書出版社

統計的仮説検定の考え方

　統計的仮説検定とは：データを用いて、数学的背理法と類似した方法により、仮説を検証する手法
　例えば、ある母集団の平均（母平均）がある値とは異なることを示したい場合
　①「母平均はある値とは異なる」という命題Aを証明したい→対立仮説
　②まず命題Aを否定し、「母平均はある値と等しい」と仮定する→帰無仮説
　③「母平均はある値と等しい」と仮定したもとで、データを取り、標本平均を求める。この標本平均が②の仮定の下では、極めて稀にしか得られない値であることを観察する
　④命題Aの否定「母平均はある値と等しい」はおかしいと判断し、命題A「母平均はある値と等しい」は正しいと判断する

検定法の導出

　確率変数 $X$ 、正規分布 $N(\mu,\sigma^2)$ について、母分散 $\sigma^2$ が既知で、母平均 $\mu$ が $\mu_0$ ではないことを検証する統計的仮説検定を考える。
対立仮説 $H_1$ ：母平均 $\mu$ は $\mu_0$ でない
帰無仮説 $H_0$ ：母平均 $\mu$ は $\mu_0$ である
互いに独立な確率変数 $X_1,X_2,...,X_n$ の標本平均 $\bar{X}$ は正規分布 $N(\mu,\sigma^2/n)$ に従うことから、統計量 $Z=\dfrac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}$ は標準正規分布 $N(0,1)$ に従う。ここで $H_0$ が正しいと仮定すると、統計量 $Z_0=\dfrac{\bar{X}-\mu_0}{\sqrt{\sigma^2/n}}$ は標準正規分布に従う。この $Z_0$ は検定統計量と呼ばれる。
帰無仮説 $H_0$ のもと稀だと判断する基準を有意水準という。有意水準5%の場合 $|Z_0|\geq1.96$ のとき帰無仮説 $H_0$ を棄却する、あるいは有意水準5%で有意であるという。
両側検定：上例のように $Z_0$ の棄却域を分布の両側（ $|Z_0$ \geq1.96])に設定している検定
片側検定：対立仮説を $\mu\neq\mu_0$ ではなく、 $\mu\ge\mu_0$ や $\mu\le\mu_0$ の場合、 $Z_0\geq1.96$ や $Z_0\leq1.96$ のように分布の片側だけの棄却域が適切な場合がある。
P値：帰無仮説 $H_0$ の下で、観察されたデータがどれだけ稀かを示す確率である。Ｐ値はデータが観測されて計算される値であり、有意水準とは異なる概念である。

サンプルサイズ設計

第一種の過誤：帰無仮説 $H_0$ が真であるのに、有意と判定してしまうこと。有意水準 $\alpha$ による制御される。
第二種の過誤：対立仮説 $H_1$ が真であるので、有意と判定されないこと。その確率 $\beta$ に対し、 $1-\beta$ を検出力とよぶ。
帰無仮説 $H_0$ の時と対立仮説 $H_1$ の時の、検定統計量 $Z_0$ の分布を考える。帰無仮説 $H_0$ の時は $Z_0\sim N(0,1)$ である（分布0）。一方、対立仮説 $H_1$ の時は母平均を $\mu_1$ とすると、 $Z_0\sim N(\dfrac{\mu_1-\mu_0}{\sqrt{\sigma^2/n}},1)$ となる（分布1)。
これら2つの分布の一部は重なっており、棄却限界値を境として、棄却限界値より大きい分布0の面積を第一種の過誤確率 $\alpha$ と、棄却限界値より小さい分布1の面積を第二種の過誤確率 $\beta$ として定義できる。つまり、棄却限界値の値により $\alpha$ と $\beta$ はトレードオフ関係にある。ただし、分布１の平均値より $\mu_1-\mu_0$ が大きくなるか、 $\sqrt{\sigma^2/n}$ が小さくなるつまり $n$ が大きくなる時に2つの分布が離れ、 $\alpha,\beta$ の面積がともに小さくなることが分かる。

抜取検査

抜取検査：検査ロットから、あらかじめ定められた抜き取り検査方式に従って、サンプルを抜き取って試験し、その結果をロットの判定基準と比較して、そのロットの合格・不合格を判定する検査
①検査ロットを定め、そのロットを構成する製品の数Nを特定する。
②検査ロットから抽出する標本の大きさnを定める。
③検査ロットの合格・不合格の判定基準を定める。
判定基準を、標本数n中の不良個数kがcより小さいとき合格、大きいとき不合格とする。ここでcは合格判定個数と呼ぶ。
合格ロットの不良率を $p_0$ 、不合格ロットの不良率を $p_1$ とすると、本来は合格である検査ロットが不合格になる確率 $FP$ は
$\displaystyle FP=\sum_{k=c+1}^n \begin{pmatrix} n \\k \\ \end{pmatrix} p_0^k(1-p_0)^{n-k}$ 　→生産者危険
となり、一方本来は不合格である検査ロットが合格になる確率 $FN$ は
$\displaystyle FP=\sum_{k=1}^n \begin{pmatrix} n \\k \\ \end{pmatrix} p_1^k(1-p_1)^{n-k}$ 　消費者危険

参考：

サンプルサイズの決め方 (統計ライブラリー)

作者:永田靖
朝倉書店

Amazon