· 

ノンパラメトリック検定

(著)山たー

ノンパラメトリック検定は、頑健(robust)であるといわれる。つまり、モデルの仮定や異常値・外れ値などに影響されにくい。反面、パラメトリック検定よりも検定力は落ちることが多い。

ウィルコクソンの順位和検定

サンプルサイズが$n_1,n_2$の2対の標本がある。2つの群を合わせて観測値(得点)を下から上へ順位付けする(つまり、順位番号が大きいほど観測値が大きくなるようにする。これは一般の感覚とは逆である)さらに、同点の順位には、順位の平均値を与える(例えば、2, 3位が同点の場合、2つとも2.5位とする)。大標本$(n_1, n_2\geq10)$における$Z$値は、2つの順位和のうち小さいほうを$W$、対の個数を$n_1, n_2$とすると、 $$ z=\frac{W-\mu_w}{\sqrt{{\sigma_w}^2}} $$ ここで、順位和の期待値は$\mu_w=\dfrac{n_1(n_1+n_2+1)}{2}$, 分散は${\sigma_w}^2=\dfrac{n_1n_2(n_1+n_2+1)}{12}$と表される。$n_1, n_2\lt10$(小標本)のときはウィルコクソンの順位検定の棄却限界の表と比較する。

符号検定

1標本$t$検定のノンパラメトリック版である。標本が仮説された中央値を持つかどうか検定するのに使われる。誤差分布の形を特定しなくても、誤差が原点について対称であると仮定できるときに使うことができる。1群で平均が0と考えられる標本や、サンプルサイズが等しい2対の標本の観測値の差の平均が0かどうかということに適用できる。観測値が正の符号の数を$n_+$、負の符号の数を$n_-$とし、$N=n_++n_-$とする。すなわち$N$はサンプルサイズから0の値をとるデータの数を引いたものである(要するに0の値を取るものは考えない)。大標本$(N\geq25)$における$Z$値は、正の符号の数を$n_+$、$p$を帰無仮説の下で観測値が仮説された中央値より大きい値を取る確率である(普通$p=0.5$)。 $$ z=\frac{(n_+\pm0.5)-Np}{\sqrt{Np(1-p)}} $$ 0.5は連続補正である。$\pm$が付いているが、$n_+\gt Np$のとき$(X-0.5)$、$n_+\leq Np$のとき、$(X+0.5)$とする。なお、$Np$は二項分布の平均、$Np(1-p)$は二項分布の分散である。また、$Z$値の$n_+$の部分は$n_-$でも同じなので、$r=\min(n_+, n_-)$として $$ z=\frac{(r+0.5)-Np}{\sqrt{Np(1-p)}} $$ と表記することもできる。 $5\lt N\lt 25$の場合は直接確率を計算する。$n_++n_-=N$とするとき、P値は $$ P=\textrm{Pr}(N\leq n_+)=\frac{\displaystyle \sum_{i=0}^{n_+} {}_N\textrm{C}_i}{2^N} $$ で求められる。

ウィルコクソンの符号順位検定

サンプルサイズが等しい2対の標本がある。まず、得点対ごとに得点の差を計算する。次に、得点の差の絶対値を計算する(これを絶対差異得点と呼ぶこととする)。絶対差異得点を順位付けしてから、各順位に符号をつける。得点の差が0のとき、分析から削除する。さらに、同点の順位には、順位の平均値を与える(例えば、3, 4, 5位が同点の場合、すべて4位とする)。大標本$(n\geq25)$における$Z$値は、正順位の和を$T^+$、同点対を取り除いた対の個数を$n$とすると、 $$ z=\frac{T^{+}-\mu}{\sqrt{\sigma^2}} $$ ここで、順位和の期待値は$\mu=\dfrac{n(n+1)}{4}$, 分散は$\sigma^2=\dfrac{n(n+1)(2n+1)}{24}$と表される。$n\lt25$(小標本)のときはウィルコクソンの符号順位検定の棄却限界の表と比較する。

マクネマー検定

相関のある場合のクロス表ではピアソンの$\chi^2$検定は適用できない。代わりにマクネマーの$\chi^2$検定を用いる。 \begin{align*} \begin{array}{c|c|c|c|c} &&後&\\ \hline &&+&-&計\\ \hline 前&+&a&b&a+b\\ \hline &-&c&d&c+d\\ \hline &計&a+c&b+d&n\\ \hline \end{array} \end{align*} マクネマー検定では等しい集団に対してイベント発生前後での変化を検定する。例えば「薬を投与した前後で悪寒が改善されたか、悪化したか、変化なしか」、ということや、「コマーシャルを見た前後で購買意欲は高くなったか、低くなったか、変化なしか」などということに適用できる。検定においては変化のないグループ(表では$a, d$)については無視し、変化のあるグループ(表では$b, c$)について注目する。このとき、検定統計量は $$ \frac{{(b-c)}^2}{b+c}\sim \chi_1^2 $$ となる(自由度1の$\chi^2$分布に従う)。イェーツの連続修正(Yate's continuity correction)を用いる場合は、 $$ \frac{{(|b-c|-1)}^2}{b+c}\sim \chi_1^2 $$ とする。期待度数が5未満、すなわち$\dfrac{b+c}{2}\lt5$のときはフィッシャーの正確確率検定(Fisher's exact test)を用いる。