◆母平均の差の検定(3/6)◆
7. 棄却限界値と有意点
前に走り高跳び、リンボーダンスのバーが、T値やP値と比較する棄却限界値、有意点であるという例え話をしました。
棄却限界値と有意点の求め方を習得するには、信頼度、自由度を理解しなければなりません。
信頼度
仮説検定は、母集団での効果(違い)を調べる方法です。
効果があるという判断がなされても、その結論は100%正しいといえません。
仮説検定は、当る確率が95%となるように作られています。
当たる確率を信頼度(statistics confidence)といいます。
自由度
自由度は検定手法の計算式に適用される値で、fで示します。
・対応のあるt検定は、投与前から投与後を引いた低下体温を用います。
検定で計算対象の項目(群)は低下体温1つなので、自由度fはその項目のデータ数(n)から1引いた値となります。
・対応のないt検定は、新薬Yと従来薬Xで、扱う項目(群)は2つなので、自由度fは2つの項目のデータ数(n1+n2 )から2引いた値となります。
表の下段の数値は「2(2)」のデータについて自由度fを求めたものです
対応のないt検定とウエルチt検定の自由度を比べると、後者の方が小さな値となります。
棄却限界値とは
棄却限界値の求め方
棄却限界値は有意点と自由度fによって決まります。
棄却限界値の計算は複雑で、手計算ではできません。Excelの関数で求められます。
通常の仮説検定は、信頼度95%で行いますので有意点は0.05です。
信頼度99%で行う場合は、有意点は0.01とします。
「6(1)」の自由度における有意点0.05の棄却限界値を求めると次となります。
色々な自由度について、棄却限界値を求めてみます。
・有意点は通常0.05ですが、有意点0.01についても求めました。
・棄却限界値は、有意点0.05の方が0.01よりちいさくなります。
・有意点0.05の棄却限界値は、自由度fが500以上は1.96です。
・有意点0.01の棄却限界値は、自由度fが1000以上は2.58です。
8. 信頼区間
「1(1)」の低下体温の平均値は、新薬Yは2.15℃でしたが別の患者を調べたら異なる値かもしれません。したがって、これから何万人(母集団)の患者に処方されるであろう、新薬Yの低下体温平均値の取りうる範囲を推定しなければなりません。
低下体温平均値の母集団での取りうる範囲を統計学では信頼区間(confidence interval、略名CI)といいます。
母集団平均値の信頼区間は、統計学が定めた値(仮にEとする)と、Eに調査平均値を減算、加算することによって求められます。
母集団平均値=調査平均値±E
Eは、先に学んだ棄却限界値とSE(標準誤差)との掛け算で求められます。
E=棄却限界値×SE(標準誤差)
棄却限界値とSEの掛け算で算出するEは、サンプルサイズと標準偏差が小さくなるほど、小さくなります。
ここまでの説明を要約します。
信頼区間の下限値、上限値は次式によって求められます。
SE、棄却限界値の求め方は3つの検定方法によって異なりますので、信頼区間も検定方法によって異なります。
「2(1)」のデータについて、信頼区間を求めてみます。
信頼度95%で母集団の平均値の差分を推定できたということです。
対応のないデータに適用するt検定とウエルチt検定の信頼区間を比較してみます。
信頼区間の幅はt検定の方がウエルチt検定より狭くなっています。
母集団の分散が等しい場合はt検定、異なる場合はウエルチt検定を適用します。
母集団の分散が等しい方が信頼区間推定の幅が狭くなるということです。
信頼区間による仮説検定
新薬Yは投与前後で体温平均値に違いがあったか(効果があったか)を、新薬Yの低下体温平均値の信頼区間を用いてどのようして行うかを説明します。
次の低下体温平均値信頼区間のグラフで、AとBの解熱効果を考えみます。
Aの信頼区間は0.7℃~1.3℃です。別の患者について調査したとしても低下体温平均値はこの範囲に収まるということです。もう少しいえば、最も低い0.7℃でもプラスの値だから、解熱効果があるといえます。
Bの信頼区間は-0.1℃~0.3℃です。別の患者について調査したとしても低下体温平均値はこの範囲に収まるということです。Aとの違いは最も低い値が-0.1℃とマイナスになっています。-0.1℃となった場合、低下体温平均値は投与前体温平均値から投与後体温平均値を引いた値なので、投与前体温平均値が投与後体温平均値を下回り、解熱効果がなかったとなります。
信頼区間の下限値、上限値どちらもプラスなら、解熱効果があるといえます。下限値がマイナスで上限値がプラスは、解熱効果があるといえません。
新薬Yの低下体温の仮説検定
・データ 対応がある
・検定方法 対応のあるt検定
・帰無仮説 新薬Y投与前体温平均値と新薬Y投与後平均値は同じ
・信頼区間を求める平均値 新薬Y投与前体温平均値と新薬Y投与後体温平均値の差分(新薬Y低下体温平均値)
・検定に用いる検定統計量 信頼区間の下限値と上限値
・判定 表8(2)より 下限値=0.26 上限値=1.24
信頼区間は下限値、上限値の符号どちらもプラス。
「等しい」という仮説を棄却し、「異なる」という対立仮説を採択する。
母集団において、新薬Yは信頼度95%で解熱効果があるといえる。
新薬Y低下体温平均値と従来薬X低下体温平均値の差分の仮説検定
・データ 対応がない
・検定方法 対応のないt検定
・帰無仮説 新薬Y体温平均値と従来薬X平均値は同じ
・信頼区間を求める平均値 新薬Y低下体温平均値と従来薬X低下体温平均値の差分
・検定に用いる検定統計量 信頼区間の下限値と上限値
・判定 8(2)より 下限値=0.01 上限値=0.89
信頼区間は下限値、上限値の符号どちらもプラス。
「等しい」という仮説を棄却し、「異なる」という対立仮説を採択する。
母集団において、新薬Yは従来薬Xに比べ解熱効果があるといえる。
注:ウエルチt検定は割愛しました。
統計的推定・検定の手法別解説
統計解析メニュー
最新セミナー情報
予測入門セミナー
予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。
マーケティングプランニング&マーケティングリサーチ入門セミナー
マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。
統計解析入門セミナー
統計学、解析手法の役割から種類、概要までを学びます。
アンケート調査表作成・集計・解析入門セミナー
調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。