雪乃: 「打率、ホームラン数、打点それぞれについて、順位を調べました。打率では1位がCの0.420、2位がBの0.357、・・・です。ホームラン数では1位がAの7本、2位がB,C,Lの6本、次に続くのがD、Eの5本ですが、1位と2位に4人いるので5位としました。そして、各選手について順位の合計を求めてみました。」
所長: 「結論は?」
雪乃: 「順位合計の値が最も小さい選手はB選手、次にA選手、C選手が続きます。だから総合成績1位はB選手じゃないですか?」
所長: 「順位の合計を求めたことはすばらしい。だが、順位合計には少し問題があるんだ。」
雪乃: 「どんな問題があるのですか?」
所長: 「そのことを解答する前に、雪乃に質問だ。各打撃部門で成績の最も良い1位の選手を調べると、打率は0.42のC選手、ホームラン数は7本のA選手、打点は17点のD選手だね。」
雪乃: 「はい、その通りです。」
所長: 「それぞれ1位の打率0.42、ホームラン数7本、打点17点を比較したとき、雪乃はどれが1番よい成績だと思う?どれも1位だけど、ひとつ選んでみてよ。」
雪乃: 「よく分からないけれど、データを降順に並べ替えたグラフを作ると、2位以下を大きく引き離しているCの打率0.42が一番良いように思えます。」
所長: 「データの降順グラフを描いて調べるとはいいセンスをしているね。」
雪乃: (ウフフ、嬉しいつぶやき)
所長: 「ここでさらに、雪乃に質問だ。野球とは別のデータ、例えば国語と数学のテストの成績が次だったとする。国語で90点の生徒Sと数学で90点の生徒Pとでは、どちらの方に価値があるかという問題だ。」
雪乃: 「平均点は、国語と数学どちらも65点で同じですね。だから平均点との差はどちらも25点なので、国語の90点と数学の90点の価値は同じではないですか?」
所長: 「バカモン。さっき、グラフで2位以下との差を比較して判断しただろう。」
雪乃: 「そうですね。先ほどと同じ考え方でいくと、国語は2位の65点との差が25点、数学は2位の80点との差が10点なので、国語の90点の方が数学の90点より価値があるといえます。」
所長: 「そのとおりだ。正解だけど、実際は2位との差だけで判断するのではない。データのバラツキを考慮して正解を導くんだよ。」
雪乃: 「データのバラツキって何ですか?」
所長: 「アチャチャー。データのバラツキを表す標準偏差を知らないのかい。」
雪乃: 「はい、知りません。」
所長: 「シンジラレナーイ」
雪乃: (所長のいやみの言葉は無視して)「教えてください。」
所長: 「いやだね。インターネットで標準偏差を検索して勉強しろ。」
雪乃は標準偏差をインターネットで調べ、Excelで簡単に計算できることを知った。
雪乃: 「標準偏差の計算って簡単でした。国語の標準偏差は12.6点、数学は18.7点です。だから、データのバラツキは国語の方が数学より小さいです。」
所長: 「計算の仕方だけでなく、標準偏差の意味も分かっているな。」
雪乃: 「はい。国語は1位が90点と高いけど他の生徒は55点から65点とバラツキの幅が小さく、6人全体のバラツキは小さいです。数学は1位が90点、次に80点、70点と高得点が続きますが、40点と低い得点の人もいて6人全体のバラツキは大きいです。このバラツキの大小を表したのが標準偏差です。」
所長: 「そうだね。国語はバラツキが小さい、すなわち大半の人が55点から65点の中で、90点を取るのは難しい。数学はバラツキが大きい、すなわち、40点と低い点数もいるけど70点や80点と高い点数もいるので数学では90点を取りやすいといえるんだ。」
統計探偵物語
最新セミナー情報
予測入門セミナー
予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。
マーケティングプランニング&マーケティングリサーチ入門セミナー
マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。
統計解析入門セミナー
統計学、解析手法の役割から種類、概要までを学びます。
アンケート調査表作成・集計・解析入門セミナー
調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。