統計検定準1級の学習10.検定の基礎と検定法の導出
統計的仮説検定の考え方
統計的仮説検定とは:データを用いて、数学的背理法と類似した方法により、仮説を検証する手法
例えば、ある母集団の平均(母平均)がある値とは異なることを示したい場合
①「母平均はある値とは異なる」という命題Aを証明したい→対立仮説
②まず命題Aを否定し、「母平均はある値と等しい」と仮定する→帰無仮説
③「母平均はある値と等しい」と仮定したもとで、データを取り、標本平均を求める。この標本平均が②の仮定の下では、極めて稀にしか得られない値であることを観察する
④命題Aの否定「母平均はある値と等しい」はおかしいと判断し、命題A「母平均はある値と等しい」は正しいと判断する
検定法の導出
確率変数、正規分布について、母分散が既知で、母平均がではないことを検証する統計的仮説検定を考える。
対立仮説:母平均はでない
帰無仮説:母平均はである
互いに独立な確率変数の標本平均は正規分布に従うことから、統計量は標準正規分布に従う。ここでが正しいと仮定すると、統計量は標準正規分布に従う。このは検定統計量と呼ばれる。
帰無仮説のもと稀だと判断する基準を有意水準という。有意水準5%の場合のとき帰無仮説を棄却する、あるいは有意水準5%で有意であるという。
両側検定:上例のようにの棄却域を分布の両側(\geq1.96])に設定している検定
片側検定:対立仮説をではなく、やの場合、やのように分布の片側だけの棄却域が適切な場合がある。
P値:帰無仮説の下で、観察されたデータがどれだけ稀かを示す確率である。P値はデータが観測されて計算される値であり、有意水準とは異なる概念である。
サンプルサイズ設計
第一種の過誤:帰無仮説が真であるのに、有意と判定してしまうこと。有意水準による制御される。
第二種の過誤:対立仮説が真であるので、有意と判定されないこと。その確率に対し、を検出力とよぶ。
帰無仮説の時と対立仮説の時の、検定統計量の分布を考える。帰無仮説の時はである(分布0)。一方、対立仮説の時は母平均をとすると、となる(分布1)。
これら2つの分布の一部は重なっており、棄却限界値を境として、棄却限界値より大きい分布0の面積を第一種の過誤確率と、棄却限界値より小さい分布1の面積を第二種の過誤確率として定義できる。つまり、棄却限界値の値によりとはトレードオフ関係にある。ただし、分布1の平均値よりが大きくなるか、が小さくなるつまりが大きくなる時に2つの分布が離れ、の面積がともに小さくなることが分かる。
抜取検査
抜取検査:検査ロットから、あらかじめ定められた抜き取り検査方式に従って、サンプルを抜き取って試験し、その結果をロットの判定基準と比較して、そのロットの合格・不合格を判定する検査
①検査ロットを定め、そのロットを構成する製品の数Nを特定する。
②検査ロットから抽出する標本の大きさnを定める。
③検査ロットの合格・不合格の判定基準を定める。
判定基準を、標本数n中の不良個数kがcより小さいとき合格、大きいとき不合格とする。ここでcは合格判定個数と呼ぶ。
合格ロットの不良率を、不合格ロットの不良率をとすると、本来は合格である検査ロットが不合格になる確率は
→生産者危険
となり、一方本来は不合格である検査ロットが合格になる確率は
消費者危険
参考: