第1回「相関係数」の求め方はデータタイプによって異なる~カテゴリー別平均
このシリーズでは、アイスタット統計セミナー受講者の「知っているようで、意外に知らなかった」という声をもとに、統計の基礎や分析者が陥りやすい統計の落とし穴などについて解説していきます。

「カテゴリー別平均」「相関比」を使って、2項目の関係を調べる
A社の営業社員12名の売上個数と血液型のデータがある。 血液型によって売上個数が異なるか、また、「血液型」と「売上個数」に関連があるか知りたい。 |
◆12名の売上個数のデータ
AB型 | A型 | B型 | O型
|
---|---|---|---|
20 | 3 | 39 | 16 |
18 | 5 | 29 | 7 |
13 | 10 | 16 | 10 |
① 解析手法の選定
データタイプが血液型は「カテゴリー」、売上個数は「数量」のため、解析手法「カテゴリー別平均」を適用します。
2項目の関係を把握したい場合は、まずカテゴリー別の平均値を算出し、視覚で傾向を明らかにします。
- 売上個数の平均は、B型が28個で最多。A型が6個で最小
- 血液型によって売上個数の平均値に違いがある
ということがわかります。
◆カテゴリー別平均表

② 相関係数を求める
「血液型によって売上個数の平均値に違いがある」ことがわかりましたが、「血液型」と「売上個数」は、どの程度の関連があるか(関連性の強弱 )まではわかりません。そこで相関係数を求め、判断します。
データタイプが血液型は「カテゴリー」、売上個数は「数量」なので、求める相関係数は「相関比」となります。
血液型と売上個数との相関比を求めると 0.6915 ➡ 血液型と売上個数は関連(相関)がある と判断します。
相関比を算出するにあたっての考え方
・相関比は群(血液型)の中のばらつきを見てかたまりが差別化されているかを見る方法です。
(血液型別と売上個数グラフ)
・平均値のばらつき度合いで、相関比の値は決まります。
(血液型別の売上個数の平均グラフ)
・相関比は0から1の間の値で、値が大きいほど関連性は強くなります。

関連性の強弱の解釈の仕方は、次のとおりです。

相関係数の数値は、「いくつ以上あれば関連性がある」という統計的基準はありません。下表は一般的な目安です。

③ 結論
「血液型」と「売上個数」の2項目のデータ間に「関連性がある!」と説得力のある主張ができます。
相関比0.6915より、A社の営業社員の血液型と売上個数は関連(相関)がある。
下記の「やってみよう①~④」をクリックすると、相関分析・相関係数の活用事例がご覧いただけます。
■(株)アイスタットでは、Excel で相関係数を求められる統計解析ソフトウエアを無料にてご提供中!
(何度でもダウンロード可) Windows版のみ
https://istat.co.jp/freesoft_free
■ アイスタット定期セミナー開催中
「相関係数」は【入門編】統計解析入門・基礎と活用セミナーで学べます。
アンケート調査表作成・集計・解析入門セミナー
調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。
予測入門セミナー
予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。
統計解析入門セミナー
統計学、解析手法の役割から種類、概要までを学びます。
マーケティングプランニング&マーケティングリサーチ入門セミナー
マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。
