統計検定準1級の学習10.検定の基礎と検定法の導出

統計的仮説検定の考え方

 統計的仮説検定とは:データを用いて、数学的背理法と類似した方法により、仮説を検証する手法
 例えば、ある母集団の平均(母平均)がある値とは異なることを示したい場合
 ①「母平均はある値とは異なる」という命題Aを証明したい→対立仮説
 ②まず命題Aを否定し、「母平均はある値と等しい」と仮定する→帰無仮説
 ③「母平均はある値と等しい」と仮定したもとで、データを取り、標本平均を求める。この標本平均が②の仮定の下では、極めて稀にしか得られない値であることを観察する
 ④命題Aの否定「母平均はある値と等しい」はおかしいと判断し、命題A「母平均はある値と等しい」は正しいと判断する

検定法の導出

 確率変数X正規分布 N(\mu,\sigma^2) について、母分散\sigma^2が既知で、母平均\mu\mu_0ではないことを検証する統計的仮説検定を考える。
対立仮説H_1:母平均\mu\mu_0でない
帰無仮説H_0:母平均\mu\mu_0である
互いに独立な確率変数X_1,X_2,...,X_nの標本平均\bar{X}正規分布N(\mu,\sigma^2/n)に従うことから、統計量Z=\dfrac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}は標準正規分布N(0,1)に従う。ここでH_0が正しいと仮定すると、統計量Z_0=\dfrac{\bar{X}-\mu_0}{\sqrt{\sigma^2/n}}は標準正規分布に従う。このZ_0検定統計量と呼ばれる。
帰無仮説H_0のもと稀だと判断する基準を有意水準という。有意水準5%の場合|Z_0|\geq1.96のとき帰無仮説H_0を棄却する、あるいは有意水準5%で有意であるという。
両側検定:上例のようにZ_0の棄却域を分布の両側(|Z_0\geq1.96])に設定している検定
片側検定:対立仮説を\mu\neq\mu_0ではなく、\mu\ge\mu_0\mu\le\mu_0の場合、Z_0\geq1.96Z_0\leq1.96のように分布の片側だけの棄却域が適切な場合がある。
P値:帰無仮説H_0の下で、観察されたデータがどれだけ稀かを示す確率である。P値はデータが観測されて計算される値であり、有意水準とは異なる概念である。

サンプルサイズ設計

第一種の過誤帰無仮説H_0が真であるのに、有意と判定してしまうこと。有意水準\alphaによる制御される。
第二種の過誤:対立仮説H_1が真であるので、有意と判定されないこと。その確率\betaに対し、1-\beta検出力とよぶ。
帰無仮説H_0の時と対立仮説H_1の時の、検定統計量Z_0の分布を考える。帰無仮説H_0の時はZ_0\sim N(0,1)である(分布0)。一方、対立仮説H_1の時は母平均を\mu_1とすると、Z_0\sim N(\dfrac{\mu_1-\mu_0}{\sqrt{\sigma^2/n}},1)となる(分布1)。
これら2つの分布の一部は重なっており、棄却限界値を境として、棄却限界値より大きい分布0の面積を第一種の過誤確率\alphaと、棄却限界値より小さい分布1の面積を第二種の過誤確率\betaとして定義できる。つまり、棄却限界値の値により\alpha\betaトレードオフ関係にある。ただし、分布1の平均値より\mu_1-\mu_0が大きくなるか、\sqrt{\sigma^2/n}が小さくなるつまりnが大きくなる時に2つの分布が離れ、\alpha,\betaの面積がともに小さくなることが分かる。

抜取検査

抜取検査:検査ロットから、あらかじめ定められた抜き取り検査方式に従って、サンプルを抜き取って試験し、その結果をロットの判定基準と比較して、そのロットの合格・不合格を判定する検査
①検査ロットを定め、そのロットを構成する製品の数Nを特定する。
②検査ロットから抽出する標本の大きさnを定める。
③検査ロットの合格・不合格の判定基準を定める。
判定基準を、標本数n中の不良個数kがcより小さいとき合格、大きいとき不合格とする。ここでcは合格判定個数と呼ぶ。
合格ロットの不良率をp_0、不合格ロットの不良率をp_1とすると、本来は合格である検査ロットが不合格になる確率FP
\displaystyle FP=\sum_{k=c+1}^n \begin{pmatrix} n \\k \\ \end{pmatrix} p_0^k(1-p_0)^{n-k} →生産者危険
となり、一方本来は不合格である検査ロットが合格になる確率FN
\displaystyle FP=\sum_{k=1}^n \begin{pmatrix} n \\k \\ \end{pmatrix} p_1^k(1-p_1)^{n-k} 消費者危険

参考: