第1回「相関係数」の求め方はデータタイプによって異なる
このシリーズでは、アイスタット統計セミナー受講者の「知っているようで、意外に知らなかった」という声をもとに、統計の基礎や分析者が陥りやすい統計の落とし穴などについて解説していきます。

「相関図・散布図」「単相関係数」を使って、2項目の関係を調べる
○○地区のコンビニ10店舗について、1日当りの平均売上額(日販)と、ある日の11時から14時までにおける店舗前通行量(通行人)を調べた。 通行人が多い店舗ほど、平均売上額/日が高くなるかを知りたい。 |
店舗 | 日販(万円) | 通行人(人) |
---|---|---|
A | 36 | 135 |
B | 45 | 118 |
C | 47 | 137 |
D | 49 | 139 |
E | 51 | 148 |
F | 49 | 151 |
G | 51 | 152 |
H | 54 | 162 |
I | 53 | 185 |
J | 65 | 173 |
① 解析手法の選定
データタイプが日販は「数量」、通行人は「数量」なので、解析手法は「相関図・散布図」を適用します。
2項目の関係を把握したい場合は、まず散布図を描き、視覚で傾向を明らかにします。
縦軸・横軸にとる項目にはルールがあり、縦軸は「結果」、横軸は「原因」を指定します。
通行人が多いほど日販は大きいことがわかります。

② 相関係数を求める
「通行人が多いほど日販は大きい」ことがわかりましたが、「通行人」と「日販」は、どの程度の関連があるか(関連性の強弱 )まではわかりません。そこで相関係数を求め、判断します。
データタイプが日販は「数量」、通行人は「数量」なので、求める相関係数は「単相関係数」となります。
日販と通行人との単相関係数を求めると 0.7101 ➡ 通行人と日販は関連(相関)がある と判断します。
単相関係数を算出するにあたっての考え方
・単相関係数は直線的関係を見る方法です。
・散布点が直線に近いほど関連度は強く、単相関係数は大きな値を示します。
・単相関係数は、-1 から +1 までの値をとります。
±1に近づくと相関係数が強くなり、0に近づくと弱くなります。0の場合のみ相関関係がありません。
・データの値がすべて同じ場合、単相関係数は求めることができません。

※ 相関係数の数値はいくつ以上あれば関連性があるかという
統計的基準はありません。下記は一般的な目安です。

③ 結論
「通行人」と「日販」の2項目のデータ間に「関連性がある!」と説得力のある主張ができます。
単相関係数0.7101より、通行人が多い店舗ほど、平均売上額/(日)が高くなる。
下記の「やってみよう①~④」をクリックすると、相関分析・相関係数の活用事例がご覧いただけます。
■(株)アイスタットでは、Excel で相関係数を求められる統計解析ソフトウエアを無料にてご提供中!
(何度でもダウンロード可) Windows版のみ
https://istat.co.jp/freesoft_free
■ アイスタット定期セミナー開催中
「相関係数」は【入門編】統計解析入門・基礎と活用セミナーで学べます。
アンケート調査表作成・集計・解析入門セミナー
調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。
予測入門セミナー
予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。
統計解析入門セミナー
統計学、解析手法の役割から種類、概要までを学びます。
マーケティングプランニング&マーケティングリサーチ入門セミナー
マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。
