では、aとbを求めてみましょう。
b=偏差の積和 ÷ Xの偏差平方和
=123 ÷ 88=1.4
次にaです。
a=Yの平均値-b × Xの平均値
=37-1.4 × 28=-2.1
aとbが求められたので回帰式が決まりました。
Y=-2.1+1.4X
回帰式に気温Xを代入すれば、アイスクリームの売上個数Yが予測できます。
回帰式の求め方
①2つのデータの相関係数を求めます。
②相関が強いことが確認できたら回帰式を求めます。
③求められた回帰式を用いて予測を行います。
②の求め方
・XとYの平均を求めます。
・Xの偏差平方和を求めます。
- Xについて、それぞれのデータから平均値を引きます。(=偏差)
- 求めた偏差を2乗します。(=偏差平方)
- すべての偏差平方を合計します。(=偏差平方和)
・XとYの偏差の積和を求めます。
- 「Xの偏差」と「Yの偏差」を掛けます。(=偏差の積)
- 「偏差の積」を合計します。(=偏差の積和)
- 公式にデータを代入します。
b=偏差の積和 ÷ X の偏差平方和
a=Yの平均値 - b × X の平均値
アイスの売上と気温の関係を回帰分析してみる
先生:同じように20日分のデータの回帰分析を行ってごらん。
莉子:相関係数は0.89で高いことは確認済みだから、早速回帰式に必要な値を計算してみました。必要なデータ(右表参照)をまとめました。
先生:必要なデータがそろったね。あとは直線の式に当てはまるだけだ。
莉子:Y=a+bXだから、まずbを計算します。
b=偏差の積和 ÷ Xの偏差平方和=645÷408=1.58
先生:そう。bが求められたから次はaだね。
莉子:a=Y-bX=35-1.58×28=-9.26
直線が求められました。
Y=-9.26+1.58X です。
先生:その通り。散布図に直線 Y=-9.26+1.58X を加えるとこんな感じだ。(右図参照)
莉子:データの真ん中を通る線引けたわ。
先生:この回帰式を用いれば、気温から売上個数が予測できるわけだ。 と予測できるよ。
莉子:店長の怒った回数は求められないのかしら。
先生:計算上は求められるよ。でも今回、直線回帰分析を行ったのは相関が高かったからだ。相関係数が低ければ、直線回帰分析を行っても求められる回帰式は使いものにならない。相関係数が0.7以上を目安にするといいよ。
莉子:そうだった。怒った回数と気温の関係の散布図は、直線の当てはまりが悪かったんだわ。
先生:いわゆる「分析の精度が低い」ということだ。分析の精度を表す指標として相関係数と同様によく使われる値に決定係数というものがある。
詳しい説明は省略するけど、実測値と予測値の相関係数を2乗したものと一致する値だ。どちらで判断してもいいよ。
Excelによる回帰分析
直線回帰式 Y=a+bX の a と b はExcel関数を使えば簡単に求めることができます。
意味を理解できたら、あとはExcelを使って計算しましょう。
- 傾き b=SLOPE(Yのデータ範囲,Xのデータ範囲)
- 定数項 a=INTERCEPT(Yのデータ範囲,Xのデータ範囲)
回帰分析は、Excelの分析ツールを使っても実行できます。
[分析ツール]→[回帰分析]
すぐに使える!!統計入門
最新セミナー情報
予測入門セミナー
予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。
マーケティングプランニング&マーケティングリサーチ入門セミナー
マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。
統計解析入門セミナー
統計学、解析手法の役割から種類、概要までを学びます。
アンケート調査表作成・集計・解析入門セミナー
調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。