第1回「相関係数」の求め方はデータタイプによって異なる

このシリーズでは、アイスタット統計セミナー受講者の「知っているようで、意外に知らなかった」という声をもとに、統計の基礎や分析者が陥りやすい統計の落とし穴などについて解説していきます。

◆相関分析・相関係数◆

2つの事柄(項目)の関係を知るには、「関数関係」「相関関係」「因果関係」などから判断します。

  • 関数関係 … 2つの変数の片方が決まれば、もう片方も決まる関係
  • 相関関係 … 2つの変数の間に関連が見られる(一方が変化すれば他方も変化する)関係
  • 因果関係 … 片方が原因でもう片方が結果の関係

2つの事柄(項目)の関係を相関係数を用いて調べる方法を総称して相関分析といいます。
相関係数は2つの項目間の関連性がどの程度あるかを数値的な根拠をもって示します。

相関分析には、いろいろな解析手法・相関係数がありますが、測定されたデータタイプが「量的データ(数量)」か「質的データ(カテゴリー)」かによって決まります。
2項目のデータタイプ 解析手法 相関係数 解析例
数量 数量 相関図・散布図 単相関係数 売上額(日販)× 店舗前交通量
カテゴリー 数量 カテゴリー別平均 相関比 血液型 × 売上個数
カテゴリー カテゴリー クロス集計 クラメール連関係数 年代 × 製品使用状況


統計知識の落とし穴

相関係数とは何か?と書籍やネットで調べてみると、 「2 種類のデータの関係を示す指標で、値が 1 や -1 に近いほど相関が強く、0 に近いほど相関が弱い」といった「単相関係数(ピアソンの積率相関係数)」の解説が主です。
実はここに落とし穴が!次のように解釈している方は注意が必要です。

  • NG ①  相関係数は「数量データ」と「数量データ」の単相関係数しか算出できないと思っている
  • NG ②「データタイプ」を考えずに、Excelや「統計ソフト」の機能で単相関係数を求めてしまう
相関係数は、解析手法「カテゴリー別平均」「クロス集計」でも求めることができます。

■(株)アイスタットでは、Excel で相関係数を求められる統計解析ソフトウエアを無料にてご提供中!

(何度でもダウンロード可) Windows版のみ

https://istat.co.jp/freesoft_free


■ アイスタット定期セミナー開催中

「相関係数」は【入門編】統計解析入門・基礎と活用セミナーで学べます。

https://istat.co.jp/seminar/statistics


下記の「やってみよう①~④」をクリックすると、相関分析・相関係数の活用事例がご覧いただけます。

相関分析の手順

① 解析手法の選定

データタイプを見て解析手法(「相関図・散布図」「カテゴリー別平均」「クロス集計」)を選び、解析します。
解析結果のグラフや数表から、2項目のデータの関連性(傾向)を明らかにします。
ただし、この段階では2項目間のデータの関連性(傾向)の強弱(強さ・大きさ)はわかりません。
そこで相関係数を求め、求めた数値から関連性の強さを明らかにします。 

② 相関係数を求める

2項目のデータ間に関連性が認められるとき、2項目のデータには相関関係があるといいます。
「相関関係がある(関連がある)」「相関関係がない(関連がない)」は、相関係数の数値から判断します。いくつ以上という統計的基準はありません。
相関係数算出するにあたっての考え方判断基準  
単相関係数 直線的関係を見る方法
※散布点が直線に近いほど関連度は強く、単相関係数は大きな値を示す
0.3が境目
相関比 群の中のばらつきを見て、かたまりが差別化されているかを見る方法
※平均値のばらつき度合いで相関比の値は決まる。
0.1が境目
クラメール連関係数 行項目と列項目の関連の強さを示す指標0.1が境目


アンケート調査表作成・集計・解析入門セミナー

調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。

予測入門セミナー

予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。

統計解析入門セミナー

統計学、解析手法の役割から種類、概要までを学びます。

マーケティングプランニング&マーケティングリサーチ入門セミナー

マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。