《因子分析(1/3) 》

1. 因子分析はどのような解析手法か

主成分分析との比較で、因子分析はとはどのような解析手法かを調べる
多変量解析の手法は、目的変数がある場合とない場合の二つに分けられます。目的変数のない場合の手法は、説明変数が数量データの場合とカテゴリーデータの場合の二つに分けられます。説明変数が数量データの場合の手法は、主成分分析と因子分析があります。どちらの手法も、数多くの変数から少数の潜在変数を作ります。
 主成分分析と因子分析は非常に類似した手法ですが、潜在変数の作られ方に違いがあります。主成分分析の潜在変数は、一つは総合力があり、それ以外の潜在変数は相反する概念のもの、例えば、文系能力と理系能力、お笑い系能力とアイドル系能力など、となります。
 これに対し因子分析の潜在変数は、総合力が存在しません。そして潜在変数一つ一つが一つの概念、例えば、1番目潜在変数は文系能力、2番目潜在変数は理系能力を現します。
 右のAが因子分析、Bが主成分分析の結果です。












因子分析が適用できるテーマ

  △△は、全国に300店のコンビニを持つ会社です。300店の売上をみると、1日の売上(日販)は20万円~100万円とさまざまです。売上の大小は、立地条件が大きく寄与していることはいうまでもありませんが、取り扱っている商品・サービスの内容、商品の味・新鮮さ、店のレイアウト・清潔感、従業員の接客態度なども起因していると考えられます。
 そこで、これらの要素について、顧客がどのように評価しているかを知るために、△△の20店を対象に来店客のアンケート調査を行いました。右の表は、店ごとに、9つの評価項目の平均値を示したものです。
 この結果を分析し、店を評価する潜在変数を作成します。潜在変数で個々のお店を得点化します。得点より個々のお店を評価し、各店の今後の経営方針を決定します。
 このデータは説明変数だけで目的変数がありません。データは全て数量データです。分析は通し新しく見出す潜在変数に総合力がありません。これらからこのテーマは、因子分析の適用が最適だといえます。

因子分析が適用できるデータ

 主成分分析は説明変数の個数が個体数より多くても実行できましたが、因子分析は説明変数の個数より個体数が多くなければいけません。
 目的変数のない場合の手法では係数矛盾現象は起こりません。したがって説明変数相互の相関が高いデータでも問題ありません。
 ある観察変数のデータが全て同じ場合、多変量解析同様実行できません。

2.  因子分析ら明らかにできること

関係式の係数/因子負荷量

 因子分析の出力内容は主成分分析と同様に、関係式の説明力、関係式の係数、各個体の得点です。
 関係式の係数を主成分分析は固有ベクトルと言いましたが、因子分析は因子負荷量と言います。各個体の得点は、前者は主成分得点、後者は因子得点と言います。
 コンビニアンケートデータに因子分析を行いました。下記A表に因子負荷量を示しました。因子負荷量を解釈するために、B表のように並べ換えました。どの因子も、プラスとマイナスの値が混在しており、総合力を表す潜在変数がないことがわかります。 
 因子負荷量は各因子と観察変数との相関の度合いを示す、-1から+1の間の値です。
 因子負荷量の値から各因子がどのような潜在変数であるかが把握できます。
 値が0.5以上の因子負荷量をみると、1番目の因子は「品揃えが豊富」「取次サービスが充実」「新鮮である」「味がよい」で、この因子は商品・サービスを評価する潜在変数であるといえます。2番目は「イメージがよい」「レイアウトがよい」でこの因子は店舗を評価する潜在変数、3番目は「処理時間が早い」「品切れがない」でこの因子は業務のシステム化(ルーチン化)を評価する潜在変数、4番目は従業員を評価する潜在変数だといえます。
 主成分分析において総合力以外の主成分は、固有ベクトルが0.5以上の大きな値、-0.5以下の小さな値が存在し、主成分は相反する概念の潜在変数と判断しました。因子分析は当該因子において因子負荷量が0.5以上のものがあると-0.5以下が存在せず、一つの因子が一つの潜在変数を表すと判断します。
関係式の説明力

 因子分析をパソコンソフトで行うと下記が出力されます。表内の累積寄与率が適用した潜在変数までの説明力を示しています。
 表内の固有値は各因子の説明力で、合計すると観察変数の個数に一致します。因子は固有値が大きい順に第1因子、第2因子、・・・、と名称します。寄与率は各固有値を観察変数の個数で割った値です。累積寄与率は当該因子までの寄与率の合計です。
 主成分分析の潜在変数個数は3以下にするのがよいと言いました。これに対し、因子分析の潜在変数の個数は、1つの因子が1つの潜在変数となるため潜在変数の個数は多くなります。第3因子まで適用した場合の説明力は61%で先生が基準にいている60%を上回っていますが、ここでは第4因子までを選択しました。
注1.固有値が1以上の因子は重要という基準で因子を選択するのも一つの方法です。
注2.前のB表によって求められた2乗和は固有値に一致します。