統計検定2級のフィードバック(後編)

(著)ざっきぃ

前回に引き続き、2級で間違えたところor迷ったところの特集です。今回の内容はあまり本質的ではなく、雑多なことが多いです。

10番

ラスパイレス指数について。その場で考えさせる問題かと思いきや、教科書にちゃんと太字で載っていました。いやはや。 基準時点を$t=0$と表し、$t$時点の第$i$品目の価格、数量をそれぞれ$p_{ti},q_{ti}$と表します。このとき、 \[\frac{\sum_{i}^{}p_{ti}q_{0i}}{\sum_{i}^{}p_{0i}q_{0i}}\] の式で表される指数を、ラスパイレス指数(Laspeyres index)といいます。要するに、数量を調べるのは価格調査に比べて格段に難しいので、 数量は基準時のままで計算しよう、という考え方です。

ちなみにこのラスパイレス指数、日本では、「国家公務員に比べた地方公務員の給料」の指数として よく用いられるそうです。こちらも同じ発想で、給料を調査するよりも各給料をもらっている人数 (どの階級の人が何人…)を調べる方が難しいので、階層ごとの人数を国家公務員基準で考える、ということです。

12番

記述IIの正誤で迷ったので、掲載しておきます。多段抽出とは、例えば学生を抽出するときに、いくつかの県を選び、選んだ県の中からいくつかの学校を選び、選んだ学校の中からいくつかの学年を選び、そこから全員を抽出する、というような、何段階にも分けた抽出法です。ただし、あくまで「グループ」を絞ってしまっているので、代表性は高いとは言えません。学生の例でいうと、たまたま選んだ学校が進学校ばかりだったら、優秀な生徒ばかりが選ばれてしまいますよね。ということで、標本に偏りが生じるリスクは高まります。

 

これを防ぐために、例えば偏差値別にざっと分けた上で、そこから多段抽出を行うなど、層化抽出と組み合わせた「層化多段抽出」が勧められています。

18番

$F$分布について。$F(m_1,m_2)$の下側100%点$F_{1-\alpha}(m_1,m_2)$は、 $F(m_2,m_1)$の上側100%点$F_{\alpha}(m_2,m_1)$の逆数に等しいそうです。それだけの話なんですが、単純に知りませんでした。

28番

僕は雰囲気で正解しちゃったのですが、母比率の差の検定です。標本比率を$\hat{p_i}$として、帰無仮説$H_0:p_1=p_2$を検定したいとします。すると、 $\hat{p_i}$は近似的に正規分布$\displaystyle{N(p_i,\frac{p_i(1-p_i)}{n_i})}$に従うので、それらの差も、以下のような正規分布に従います。 \[\hat{p_1}-\hat{p_2}~N(p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2})\] 従って、以下の統計検定量$z$が標準正規分布に従うことを利用して、検定を行います。 \[z=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{ \frac{\hat{p_1}(1-\hat{p_1})}{n_1}+\frac{\hat{p_2}(1-\hat{p_2})}{n_2}}}\]