◆カッパ係数◆

5つの変数について40人の測定データがある。
測定データを二つの計算方法(No1、No2と名称)で変換した。
No1、No2の変換データにクラスター分析を行い、各々4つのクラスターを作成した。
両者のクラスター数は以下となった。
両者の一致度を調べるために、クロス集計を行った。
判別的中率を算出した。
判別的中率=対角線度数の合計÷全度数
     =(5+16+7+3)÷40=31÷40=0.775
一致度をカッパ係数(Cohen’s Kappa)で調べた。
判別的中率は「偶然による一致率」を勘案していない点で、
 「見かけ上の一致率(observed degree of agreement)」と
いわれる。カッパ係数は判別的中率から見かけ上の一致率を
除去したものである。偶然の一致率は次によって算出できる。
縦計をT1,T2,T3,T4、横計をY1,Y2,Y3,Y4、全度数をnとする。

カッパ係数=(判別的中率-偶然の一致率)÷(1-偶然の一致率)
       =(0.775-0.326)÷(1-0.326)=0.666
カッパ係数は高い値を示し、検定によるp値は0.000で、No1、No2の計算方法によって作成されたクラスター数は一致しているといえる。ゆえに2つの計算方法によるクラスター分けに差異がないといえる。