(著)山たー
ケンドール(Kendall)の一致係数$W$は、異なる審査員や回答者間によって被験者(変数)内においてつけられた順位の関係性や一致度を示す統計量で、0~1の値を取る。0が順位バラバラ、1が順位が完全に一致である。例えば、複数人における料理の好みの順位が同じ傾向かどうかなどに使える。まず定義式について考え、その後に具体例をあげて解析する。
定義式
評価対象が$n$個、評価者が$m$人いるとする。ここで、$O_i$は$i$番目($i=1,2,\cdots,n$)の評価対象(Object)、$J_j$は$j$番目($j=1,2,\cdots,m$)の評価者(Judge)とする。$J_j$によって評価された$O_i$の$O_1, O_2, \cdots, O_n$の中における順位を$r_{ij}$とする。このとき、次のような評価が得られたとする。 $$ \begin{array}{c|ccccc} & J_1 & J_2&J_3&\cdots&J_m\\ \hline O_1 & r_{11}&r_{12}&r_{13}&\cdots &r_{1m}\\ O_2 & r_{21}&r_{22}&r_{23}&\cdots &r_{2m}\\ O_3 & r_{31}&r_{32}&r_{33}&\cdots &r_{3m}\\ \vdots&\vdots&\vdots&\vdots&\ddots&\vdots\\ O_n &r_{n1}&r_{n2}&r_{n3}&\cdots &r_{nm}\\ \hline \end{array} $$ 以下の数値を順に求める。まず、$O_i$の順位和$R_i$を $$ R_i=\sum _{j=1}^m r_{ij} $$ とし、順位和の平均$\bar{R}$を $$ \bar{R}=\frac{1}{n}\sum _{i=1}^n R_i $$ によって求める。さらに順位に関する平方和$S$を $$ S=\sum _{i=1}^n(R_{i}-\bar{R})^2 $$ とする。これらを表にすると次のようになる。 $$ \begin{array}{c|ccccc|c|c} & J_1 & J_2&J_3&\cdots&J_m&順位和R_i=\sum _{j=1}^m r_{ij}&(R_i-\bar{R})^2\\ \hline O_1 & r_{11}&r_{12}&r_{13}&\cdots&r_{1m}&R_1=r_{11}+r_{12}+\cdots+r_{1m}&(R_1-\bar{R})^2\\ O_2 & r_{21}&r_{22}&r_{23}&\cdots&r_{2m}&R_2=r_{21}+r_{22}+\cdots+r_{2m}&(R_2-\bar{R})^2\\ O_3 & r_{31}&r_{32}&r_{33}&\cdots&r_{3m}&R_3=r_{31}+r_{32}+\cdots+r_{3m}&(R_3-\bar{R})^2\\ \vdots&\vdots&\vdots&\vdots&\ddots&\vdots&\vdots&\vdots\\ O_n &r_{n1}&r_{n2}&r_{n3}&\cdots &r_{nm}&R_n=r_{n1}+r_{n2}+\cdots+r_{nm}&(R_n-\bar{R})^2\\ \hline &&&&&合計&\sum _{i=1}^n R_i&S=\sum _{i=1}^n(R_{i}-\bar{R})^2\\ &&&&&平均&\bar{R}=\frac{1}{n}\sum _{i=1}^n R_i& \end{array} $$
このときケンドールの一致係数$W$は $$ W=\frac{評価対象別順位和の分散}{評価対象別順位和の理論最大値}=\frac{\frac{1}{n-1}S}{\frac{mn(n+1)}{12}}=\frac{12S}{m^2n(n^2-1)} $$ と定義される。
$W$が大きければ順位の間における関係は強いといえる。だが、本当に順位の間に関係がある(順位が一致している)ことを示すには次のようにする。まず、帰無仮説$H_0$と対立仮説$H_1$を次のようにおく。 \begin{align*} H_0 : 評価者の間における順位の一致はない(各評価者による順位の間に関係はない)\\ H_1 : 評価者の間における順位の一致がある(各評価者による順位の間に関係がある) \end{align*} この帰無仮説$H_0$の下でカイ二乗検定を行う。カイ二乗統計検定量は $$ \chi^2=m(n-1)W $$ で求められる。ただし自由度$df$は $$ df=n-1 $$ である。すなわち、$m(n-1)W\sim \chi^2_{(n-1)}$である。また、これが成り立つのは$n\geq5$または$m\geq15$のとき(大標本のとき)である。$p$値が$p\lt 0.05$になった場合、有意水準5$%$の下で帰無仮説は棄却される(すなわち順位の間に関係があるといえる)。
(例1)絵画の採点の一致度
絵画$A, B, \cdots, H$に対して評価者1~4が以下のように順位をつけたとする。 $$ \begin{array}{c|ccc} & 評価者1 & 評価者2&評価者3\\ \hline A& 8 & 5 & 7\\ B & 4 & 3 & 5\\ C & 2 & 4 & 1\\ D & 3 & 8 & 3\\ E & 6 & 2 & 2\\ F & 1 & 1 & 8\\ G & 5 & 7 & 4\\ H & 7 & 6 & 6\\ \hline \end{array} $$ 知りたいのは、この順位のつけ方が評価者の間でどれぐらい一致しているかということである。帰無仮説$H_0$を「評価者の間に順位の一致はない」として、このデータから前述の方法によりケンドールの一致係数$W$を求める。 $$ \begin{array}{c|ccc|cc} & 評価者1 & 評価者2 & 評価者3&順位和R_i&(R_i-\bar{R})^2\\ \hline A & 8 & 5 & 7 & 20 &42.25\\ B & 4 & 3 & 5 & 12 &2.25 \\ C & 2 & 4 & 1 & 7 &42.25\\ D & 3 & 8 & 3 & 14 &0.25 \\ E & 6 & 2 & 2 & 10 &12.25\\ F & 1 & 1 & 8 & 10 &12.25\\ G & 5 & 7 & 4 & 16 &6.25\\ H & 7 & 6 & 6 & 19 &30.25\\ \hline & & & 合計 & 108 &148\ (=S)\\ & & & 平均 & 13.5\ (=\bar{R})& \end{array} $$ ゆえに$n=8, m=3$に注意して、 \begin{align*} W&=\frac{12S}{m^2n(n^2-1)}\\ &=\frac{12\cdot148}{3^2\cdot8\cdot(8^2-1)}\\ &\simeq0.3915 \end{align*} となる。これより、$\chi^2=m(n-1)W=8.22,\ df=n-1=7, p=0.3134$となる。なお、p値はExcelだと''CHISQ.DIST.RT($\chi^2, df$)''で求められる。よって有意水準5%の下では帰無仮説は棄却されない。人の感性はそれぞれであるということが分かる。
(例2)主要国における死亡原因の比較
主要国において死亡原因がどれぐらい一致しているかを調べよう。データは
主要国の男性の死亡原因を順位で表すと以下のようになる。 $$ \begin{array}{c|cccc} 死亡原因(男) & 日本 & アメリカ & ドイツ & オーストラリア \\ \hline 1 & 悪性新生物 & 循環器系の疾患 & 循環器系の疾患 & 悪性新生物 \\ 2 & 循環器系の疾患 &
悪性新生物 & 悪性新生物 & 循環器系の疾患 \\ 3 & 呼吸器系の疾患 & 呼吸器系の疾患 & 呼吸器系の疾患 & 呼吸器系の疾患 \\ 4 & 消化器系の疾患 & 不慮の事故 & 消化器系の疾患 & 不慮の事故 \\ 5 & 不慮の事故 & 消化器系の疾患 & 不慮の事故
& 消化器系の疾患 \\ 6 & 自殺・外傷 & 自殺・外傷 & 自殺・外傷 & 自殺・外傷 \\ 7 & 結核 & \textrm{HIV} & \textrm{HIV} & \textrm{HIV} \\ 8 & \textrm{HIV} & 結核 & 結核 & 結核 \\
\hline \end{array} $$ これを解析しやすい形に置き換えると次のようになる。 $$ \begin{array}{c|cccc} 死亡原因(男) & 日本 & アメリカ & ドイツ & オーストラリア \\ \hline 悪性新生物 & 1 & 2 & 2 & 1 \\ 循環器系の疾患 & 2
& 1 & 1 & 2 \\ 呼吸器系の疾患 & 3 & 3 & 3 & 3 \\ 消化器系の疾患 & 4 & 5 & 4 & 5 \\ 不慮の事故 & 5 & 4 & 5 & 4 \\ 自殺・外傷 & 6 & 6 & 6 & 6 \\
結核 & 7 & 8 & 8 & 8 \\ \textrm{HIV} & 8 & 7 & 7 & 7 \\ \hline \end{array} $$ 同様に計算すると、 $$ \begin{array}{c|cccc|cc} 死亡原因(男) & 日本 & アメリカ & ドイツ &
オーストラリア &順位和R_i&(R_i-\bar{R})^2\\ \hline 悪性新生物 & 1 & 2 & 2 & 1 & 6 & 144 \\ 循環器系の疾患 & 2 & 1 & 1 & 2 & 6 & 144 \\ 呼吸器系の疾患 & 3 & 3
& 3 & 3 & 12 & 36 \\ 消化器系の疾患 & 4 & 5 & 4 & 5 & 18 & 0 \\ 不慮の事故 & 5 & 4 & 5 & 4 & 18 & 0 \\ 自殺・外傷 & 6 & 6 & 6 & 6
& 24 & 36 \\ 結核 & 7 & 8 & 8 & 8 & 31 & 169 \\ \textrm{HIV} & 8 & 7 & 7 & 7 & 29 & 121 \\ \hline & & & & 合計 & 144 &
650\ (=S)\\ & & & & 平均 & 18\ (=\bar{R})& \\ \end{array} $$ となる。ゆえに$n=8, m=4$であるので、 \begin{align*} W&=\frac{12S}{m^2n(n^2-1)}\\
&=\frac{12\cdot650}{4^2\cdot8\cdot(8^2-1)}\\ &\simeq0.96726 \end{align*} これより、$\chi^2=m(n-1)W=27.083,\ df=n-1=7, p=0.000322
$となる。よって有意水準5%の下で帰無仮説は棄却される。先進国では死亡原因の順位は多少前後するものの、ほとんど一致することが分かる。
同順位がある場合の補正
同順位がある場合、ケンドールの一致係数$W$は次式のように補正する。 $$ W=\frac{12S}{\displaystyle m^2n(n^2-1)-m\sum_{j=1}^m T_j},\ \ T_j=\sum_{k=1}^{g_j} (t_k^3-t_k) $$ ただし、 \begin{align*} t_k&=(k番目の同順位グループ内の同順位の数)\\ g_j&=(j番目の順位セット内の同順位グループの数) \end{align*} とする。これは少しややこしいので例を挙げよう。例えば評価値が$\{10, 20, 30, 20, 20, 20,40\}$となる組があったとしよう。普通に順位をつけると、順位は小さい方から$\{1,2,6,2,2,2,7\}$となる。2番目が4つあるが、これは本来2,3,4,5位となるはずであった。このとき、順位は2,3,4,5位の平均をとって3.5とする。つまり$\{1,3.5,5,3.5,3.5,3.5,6\}$というように修正する。ここで、同じ評価値20をとった3.5位の組のようなものを「同順位グループ」と呼ぶこととする。このとき$g_j=1$であり、$t_k=4$である。当然だが、同順位がない場合は$t_k=0$であり、$T_j=0$となる。
(例3)同順位がある場合のお菓子の採点の一致度
お菓子$A, B, \cdots, H$に対して評価者1~4が以下のように10点満点で点数をつけたとする(これは同順位を認めた順位のつけ方と同じである)。 $$ \begin{array}{c|cccc} & 評価者1 & 評価者2 & 評価者3 & 評価者4 \\ \hline A & 8 & 5 & 6 & 3 \\ B & 4 & 3 & 5 & 5 \\ C & 2 & 4 & 1 & 1 \\ D & 3 & 7 & 3 & 4 \\ E & 6 & 1 & 2 & 1 \\ F & 1 & 1 & 6 & 8 \\ G & 5 & 7 & 4 & 7 \\ H & 7 & 6 & 6 & 6 \\ \hline \end{array} $$ ここで、同点の順位には、順位の平均値を与える(例えば、3, 4, 5位が同点の場合、すべて4位とする)こととすると、以下のように順位をつけられる。 $$ \begin{array}{c|cccc} & 評価者1 & 評価者2 & 評価者3 & 評価者4 \\ \hline A & 8 & 5 & 7 & 3 \\ B & 4 & 3 & 5 & 5 \\ C & 2 & 4 & 1 & 1.5 \\ D & 3 & 7.5 & 3 & 4 \\ E & 6 & 1.5 & 2 & 1.5 \\ F & 1 & 1.5 & 7 & 8 \\ G & 5 & 7.5 & 4 & 7 \\ H & 7 & 6 & 7 & 6 \\ \hline g_j&0&2&1&1\\ T_j&0&(2^3-2)+(2^3-2)&3^3-3&2^3-2 \end{array} $$
$g_j, t_k, T_j$について説明する。まず評価者1の組は同順位がいないので$g_1=t_k=T_1=0$である。次に評価者2の組は同順位グループが1.5と7.5の2つあるので$g_2=2$であり、それぞれの同順位グループの同順位の数は2であるので$t_1=t_2=2$である。よって、$T_2=(2^3-2)+(2^3-2)$となる。評価者3の組は同順位グループが$7(=(6+7+8)/3)$の1つあるので$g_3=1$であり、同順位グループ内に同順位が3つあるので、$t_1=3$となり、$T_3=3^3-3$となる。同様な考えにより$g_4=1, T_4=2^3-2$となる。
次に、$S$を求めると以下のようになる。 $$ \begin{array}{c|cccc|cc} & 評価者1 & 評価者2 & 評価者3 & 評価者4 & 順位和R_i&(R_i-\bar{R})^2\\ \hline A & 8 & 5 & 7 & 3 & 23 & 25 \\ B & 4 & 3 & 5 & 5 & 17 & 1 \\ C & 2 & 4 & 1 & 1.5 & 8.5 & 90.25 \\ D & 3 & 7.5 & 3 & 4 & 17.5 & 0.25 \\ E & 6 & 1.5 & 2 & 1.5 & 11 & 49 \\ F & 1 & 1.5 & 7 & 8 & 17.5 & 0.25 \\ G & 5 & 7.5 & 4 & 7 & 23.5 & 30.25 \\ H & 7 & 6 & 7 & 6 & 26 & 64 \\ \hline & & & & 合計 & 144 &260\ (=S)\\ & & & & 平均 & 18\ (=\bar{R})& \\ \end{array} $$よって上記2つの表より、$n=8, m=4$に注意して、 \begin{align*} W&=\frac{12S}{\displaystyle m^2n(n^2-1)-m\sum_{j=1}^m T_j}\\ &=\frac{12\cdot260}{4^2\cdot8\cdot(8^2-1)-4\cdot[0+\{(2^3-2)+(2^3-2)\}+(3^3-3)+(2^3-2)]}\\ &\simeq0.39514 \end{align*} これより、$\chi^2=m(n-1)W=11.06383,\ df=n-1=7, p=0.1356$
コメントをお書きください
山波 (水曜日, 03 2月 2021 15:13)
めちゃくちゃ参考になりました!特に同順位の扱いについて,書籍だと1パネリスト内で複数の同順位の組が合った場合などの具体例がなく,迷っていたのでとても助かりました.
ところで,自分が参考にしてる書籍だと同順位があるときのWの式が,12S/{k^2(n^3-n)-12nΣTi}と,ΣTiの前に12倍がくっついているのです.
これは書籍の誤植でしょうか?式の意味を理解しておらず,判断できないのです.教えていただけましたら幸いです.
また,参考となる文献などについてもアドバイスいただけますととても嬉しいです.何卒よろしくお願いいたします.