· 

比率の区間推定

成功確率が$p$である試行を$n$回行うときに成功する回数を$X$とすると, $X$は二項分布$B(n,p)$に従う. この$p$が母比率に対応する. 二項分布に従う確率変数Xの期待値と分散は, $$E(X)=np,\ V(X)=np(1-p)$$ となる. $n$がある程度大きい場合, 中心極限定理により, $B(n,p)$は正規分布$N(np, np(1-p))$に近似できる. これにより, $X\sim B(n,p)$のとき, $X$を標準化した値$Z_n$は$n$が十分に大きいときには, $$ Z_n=\frac{X-np}{\sqrt{np(1-p)}}\to N(0,1) $$ となる. 標本比率$\hat{p}=\dfrac{X}{n}$を用いて$Z$を表すと, $$Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{X-np}{\sqrt{np(1-p)}}\cdot\frac{\dfrac{1}{n}}{\dfrac{1}{n}}= \frac{\dfrac{X}{n}-p}{\sqrt{\dfrac{p(1-p)}{n}}} = \frac{\hat{p}-p}{\sqrt{\dfrac{p(1-p)}{n}}}$$ となる. よって, 標準正規分布の両側$\alpha$点$z_\alpha^*$に対して, $$1-\alpha\simeq P\{|Z_n|\leq z_\alpha^*\}$$ が成り立つ. $\{\}$内の不等式を$p$について解き, 信頼限界を求めると, \begin{align*} \frac{\hat{p}-p}{\sqrt{\dfrac{p(1-p)}{n}}}&=z_\alpha^*\\ (\hat{p}-p)^2&=(z_\alpha^*)^2\dfrac{p(1-p)}{n}\\ \therefore\ [n+(z_\alpha^*)^2]p^2&-[2n\hat{p}+(z_\alpha^*)^2]p+n\hat{p}^2=0 \end{align*} となるので, これより$(1-\alpha)\times100\%$の信頼区間(信頼限界)は次のようになる:
[Wilson型信頼区間]$$\frac{1}{1+\frac{1}{n}(z_\alpha^*)^2}\left[\hat{p}+\dfrac{(z_\alpha^*)^2}{2n}\pm z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}+\frac{(z_\alpha^*)^2}{4n^2}}\right]\ \ \ \cdots(1) $$
$n$が十分大きい場合, 分散$p(1-p)$の推定量として$\hat{p}(1-\hat{p})$を用いて, 標準化 $$ Z'_n=\frac{\hat{p}-p}{\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}} $$ を考えれば, $$1-\alpha\simeq P\{|Z'_n|\leq z_\alpha^*\}$$ が成り立つ. $\{\}$内の不等式を$p$について解き, 信頼限界を求めると, \begin{align*} &-z_\alpha^*\leq\frac{\hat{p}-p}{\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}}\leq z_\alpha^*\\ &-z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\leq\hat{p}-p \leq z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\\ \therefore\ \ &\hat{p}-z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\leq p \leq \hat{p}+z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}} \end{align*} となるので, これより$(1-\alpha)\times100\%$の信頼区間(信頼限界)は次のようになる:
[Wald型信頼区間] $$ \hat{p}\pm z_\alpha^*\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\ \ \ \cdots(2) $$
(2)式は(1)式において$\dfrac{(z_\alpha^*)^2}{n}=0$として無視したものに一致する.