《多群数量化2類(2/2) 》

カテゴリースコアの散布図

 軸1を縦軸、軸2を横軸としてカテゴリースコアの散布図を描きます。項目数9、各項目カテゴリー数2(○と×)なのでカテゴリー総数は18個あります。散布図は18個のカテゴリーをプロットしていますが、カテゴリー名が○の9つの散布点に着目します。

 散布点が近い位置にある性格はどの部署にあっているかを考えます。"社交的な"と"さわやかな"は営業部、"きばつな"は企画部、"洞察力のある"と"機転のきく"はシステム部、"きくばりのある"と"慎重な"は総務部と考えました。 


サンプルスコアの散布図

 軸1を縦軸、軸2を横軸として22人のサンプルスコアの散布図を描きます。散布点の数値はデータ表の社員Noです。マーク種別は配属部署を示しています。

 カテゴリースコア散布図とサンプルスコア散布図の目盛りは異なりますが領域の方向性において両者は一致します。したがって、サンプルスコア散布図から右上に位置する社員は営業部、右下は企画部、左上は企画部、左下は総務部と推測できます。実際に配属された部署(マーク種別)との対応をみるとほぼ一致しています。


どの群に属するかの判別

 サンプルスコアの配属部署別の平均を群別重心といいます。
 軸1、軸2の属性別重心を示します。


各社員がどの部署(群)に属するかの判別は, モデル式から算出されたサンプルスコアの平面上の位置と群別重心との距離を測ることで調べられます。重心までの距離の最も短い部署(群)をその社員の推定群と呼ぶことにします。(下図参照)
 距離を測る方法に、ユークリッド距離とマハラノビス距離があります。ここでは次に示すユークリッド距離の公式を用いて距離を算出しました。


判別的中率

 配属部署と推定群との判別クロス集計の結果を示します。 ユークリッド距離において配属部署と推定群が一致しているのは22人中21人が一致しているので、 判別的中率は, 21÷22=95.5%です。下記に示す基準の62.5%を上回っているので、 2つのモデル式は配属部署の判別に適用できると判断します。

判別が最も悪い場合の判別的中率を基準とします。
予測

 今年度の新入社員Aさんについて、モデル式を用いて配属部署の予測を行います。
 Aさんの選択した性格は、"ユーモアな"、"きくばりのある"、"洞察力のある"でした。サンプルスコアは回答のあった性格のカテゴリースコアを加算すれば求められます。

サンプルスコアの散布点から群別重心までの距離を求めます。

多群数量化2類についてよくある質問

Q どの軸も相関比が低く、モデル式は用いることができません。相関比を上げるためにはどうしたらよいでしょうか。
A よいモデル式を作成するためには、説明変数が目的変数に影響を及ぼすものでなければなりません。
目的変数、説明変数のデータタイプはカテゴリーデータなので、両者の関係はクロス集計とクラメール連関係数で把握できます。クラメール連関係数が0.25以上の項目を見出し説明変数にしてください。 


  この例題のクラメー連関係数は全てが0.25を上回っているので軸1、軸2の相関比は高い値を示しました。