第1回「相関係数」の求め方はデータタイプによって異なる

このシリーズでは、アイスタット統計セミナー受講者の「知っているようで、意外に知らなかった」という声をもとに、統計の基礎や分析者が陥りやすい統計の落とし穴などについて解説していきます。

やってみよう3

「クロス集計」「クラメール連関係数」を使って、2項目の関係を調べる

Y製品の使用状況と年代のデータをクロス集計した。
Y製品の使用状況は年代によって異なるか、また、「Y製品」と「年代」に関連があるか知りたい。

① 解析手法の選定

データタイプがY製品の使用状況は「カテゴリー」、年代は「カテゴリー」なので、解析手法は「クロス集計」を適用します。
2項目の関係を把握したい場合は、まずクロス集計を行い、クロス集計表から何がいえるのかを把握します。

  • Y製品を使用している割合は20代が77%、30代が86%、40代が91%で、40代で最も多い
  • 年代が高くなるにつれ、使用率が高くなっている

ということがわかります。

② 相関係数を求める

「年代が高くなるにつれ使用率が高くなっている」ことがわかりましたが、「年代」と「使用状況」は、どの程度の関連があるか(関連性の強弱 )まではわかりません。そこで相関係数を求め、判断します。
データタイプが年代は「カテゴリー」、使用状況は「カテゴリー」なので、求める相関係数は「クラメール連関係数」となります。
年代とY製品使用状況とのクラメール連関係数を求めると 0.149➡ 年代と使用状況は関連(相関)がある と判断します。

クラメール連関係数を算出するにあたっての考え方
・クラメール連関係数は、行項目と列項目の関連の強さを示す指標です。
・クラメール連関係数は0から1の間の値で、値が大きいほど関連性は強くなります。

※クラメール連関係数の求め方は、こちらをご参照ください。

相関係数の数値は、「いくつ以上あれば関連性がある」という統計的基準はありません。下表は一般的な目安です。

③ 結論

「年代」と「使用状況」の2項目のデータ間に「関連性がある!」と説得力のある主張ができます。
クラメール連関係数0.149より、年代とY製品使用状況は関連(相関)がある。


下記の「やってみよう①~④」をクリックすると、相関分析・相関係数の活用事例がご覧いただけます。

■(株)アイスタットでは、Excel で相関係数を求められる統計解析ソフトウエアを無料にてご提供中!

(何度でもダウンロード可) Windows版のみ

https://istat.co.jp/freesoft_free


■ アイスタット定期セミナー開催中

「相関係数」は【入門編】統計解析入門・基礎と活用セミナーで学べます。

https://istat.co.jp/seminar/statistics


アンケート調査表作成・集計・解析入門セミナー

調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。

予測入門セミナー

予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。

統計解析入門セミナー

統計学、解析手法の役割から種類、概要までを学びます。

マーケティングプランニング&マーケティングリサーチ入門セミナー

マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。