1      次のページへ>>

《重回帰分析(1/3) 》

1. 重回帰分析の基本

重回帰分析で明らかにできること

重回帰分析は、目的変数と説明変数との関係を調べ、関係式を作成し、その関係式を用いて、次のことを明らかにする手法です。
※注:関係式をモデル式と呼ぶこともあります。
説明変数の目的変数に対する貢献度(影響度)
説明変数の重要度ランキング
予測

重回帰分析で適用できるデータ

 重回帰分析は、目的変数が数量データ、説明変数が数量データです。
 下記例題のデータを示しました。海外旅行回数を目的変数、人の属性を説明変数として重回帰分析を適用できるか考えてみましょう。
データの形態を調べてみます。目的変数は数量データですが、説明変数はカテゴリーデータと数量データか混在しています。このままだと重回帰分析は適用できません。
 性別のように2カテゴリーのデータの場合は、男性を1、女性を0に変換して、数量データとして扱うことができます。
 血液型のようにカテゴリー数が3以上の場合は数量データに変換できません。ただし血液型ごと例えばA型であれば、A型である→1、A型でない→0といった変換は可能です。この変換を行うと血液型がA型、O型、B型、AB型の4変数になります。従ってこのような変換までして、血液型を重回帰分析に適用するケースは稀です。どうしても血液型を適用したい場合は数量化1類を適用します。 この例題の説明変数は、性別、年齢の二つです。

重回帰分析に適用できるデータの制約

ある説明変数のデータが全て同じ場合、重回帰分析は実行できません。
任意の複数項目を選択し、個体ごとにその項目のデータの合計を計算したとき、
        どの個体も合計値が同じになる場合、重回帰分析は実行できません。
 重回帰分析に適用するデータは次式の条件を満たしてなければなりません。
 個体数>説明変数の個数+1
 先に示した営業所売上予測データについて調べると、「説明変数の個数+1」は3です。従って個体数は4以上必要です。<測定データ>の個体数は200人なので、このデータは重回帰分析が適用できます。


関係式の係数の求め方

 関係式の係数はどのようにして求めるかを考えて見ましょう。
お答えいたします。
  8千万円=0.4×5+0.5×6+3=2+3+3=8
  8千万円=0.2×5+0.5×6+3=1+3+4=8
  8千万円=0.6×5+0.5×6+3=3+3+2=8
 ・・・・・・・・・・・・・・・・・・・・・・・・
 正解は無数にあるということです。

お答えいたします。
 関係式の係数の求め方(1)の回答、0.4、0.5、3を代入してみます。

残念ながら、この答だと、6つの営業所中3つはほぼ合いましたが、3つははずれですこのように、手計算でこの問題を解くのは大変です。これを解決してくれるのが重回帰分析なのです。

 それでは、重回帰分析が導いてくれた結果を見て見ましょう。


左辺と右辺はぴったりとは一致しませんが、どの営業所についてもほぼ近くなっています。

1      次のページへ>>