《多群数量化2類 (1/2)》

多群数量化2類は、目的変数と説明変数との関係をモデル式で表し、そのモデルを用い回答者が複数個ある群のどれに属するかを判別、その判別に重要な影響を及ぼす質要因を解明します。適用できるデータタイプは、目的変数、説明変数どちらもカテゴリーデータです。

多群数量化2類の解説で適用する例題

B会社はソフトの開発・販売をしている会社です。採用した社員の配属を性格アンケートの結果を用いて行っているユニークな会社です。下記に示すデータは、昨年の新入社員22人のアンケート結果と配属部署を示したものです。
 回答結果をみて採用担当者が配属を決めていましたが、作業は大変で、今年から統計解析の手法を用いて行うことにしました。
【質問】あなたは他人からどのような性格だと
     いわれていますか。
     次に示す性格の中から該当すると
     思われる性格を4つまでお知らせください。
【データ】
 性格は、選択されれば1、
 選択されなければ0と表記します。
 配属部署は、下記のコードNoで表記します。
 1.営業部  2.企画部  3.システム部  4.総務部
多群数量化2類とは

社員の配属が社員の性格から決まるとすれば、性格から配属部署を判別するモデル式を作成できます。目的変数である配属部署は群数が3つ以上のカテゴリーデータ、説明変数もカテゴリーデータです。多群数量化2類はこのようなデータに対してモデル式を作成する解析手法です。モデル式から、各性格の配属部署への影響度や、今後の親入社員の配属部署の判別を予測することができます。
 2群の数量化2類におけるモデル式は、目的変数、説明変数を[1,0]データに変換して、これらデータに重回帰分析を行い算出ました。多群数量化2類の場合は、目的変数のカテゴリー数が3つ以上なので数値変換ができず重回帰分析が適用できません。したがって、多群数量化2類のモデル式は2群数量化2類とは別の解法で導きます。この計算方法は複雑なのでここでは割愛します。興味ある方は下記の幣著をご覧ください。
・ 書籍名「質的データの判別分析数量化2類」2011年4月現代数学社

多群数量化2類の結果の見方、活用方法

モデル式とカテゴリースコア
 目的変数の群数をG個とすると、モデル式はG個より1つ少ないm個存在します。 例題は、目的変数の群数がG=4なので、m=G-1=3です。
 m個のモデル式を軸1、軸2、・・・、軸mと呼びます。
j番目項目のカテゴリー数を Cj とすると、モデル式は i 軸は次式で示せます。
  
モデル式の係数をカテゴリースコアといいます。各カテゴリーに対してカテゴリースコアはm個存在します。各々を軸1、軸2、・・・、軸mのカテゴリースコアと呼びます。例題の各軸のカテゴリースコアを示します。表におけるnは, 各選択肢に対する回答人数です。

例題のモデル式を示します。
[1,0]データを代入して求められた値をサンプルスコアといいます。サンプルスコアを示します。



相関比

 カテゴリーデータと数量データの関係を調べる解析手法として相関比があります。配属部署はカテゴリーデータ、サンプルスコアは数量データなので、両者の関係は相関比で調べることができます。この例題の相関比を示します。
相関比は各モデル式(軸)に与えられる数値で、値は0~1の間にあり、値が大きいほどよいモデル式(軸)といえます。相関比はいくつ以上あればよいという統計学的基準はありませんが、著者は0.5を基準の値としています。

モデル式(軸)の解釈

 それぞれのモデル式(軸)が何を判別するかは、その軸でカテゴリースコアが最大の性格と最小の性格の対比から把握できます。軸1は"社交的な"と"きばつな"を判別します。以下、軸2は"きばつな"と"洞察力のある"、軸3は"洞察力のある"と"機転の利く"を判別します。
 目的変数の判別、すなわち社員をどの部署に配属するかに影響を与えているのは相関比が0.5以上の軸1と軸2です。両軸の対比性格から社員の配属は、"社交的な"と"きばつな"の違い、"きばつな"と"洞察力のある"の違いで決まると解釈できます。