<<前のページへ           4

《ロジスティック回帰(4/4) 》

標準誤差

説明変数、定数項について標準誤差が出力されます。標準誤差はWald検定の統計量や信頼区間を算出するときに用いられます。
img src=
標準誤差の求め方を示します。

img src=
ロジスティック回帰の各種統計量の求め方

不健康有無のデータで、各種統計量の計算方法を示します。

  • AIC

  • [対数尤度の合計]を最大化した値をLLと表現します。
    LL=-2.168
    -2LLを逸脱度といいます。
    -2LL=4.336

    モデル選択基準AICは次式によって求められます。
    AIC=-2LL+2×(説明変数個数+1)
    不健康有無のAIC=-2×(-2.168)+2×(2+1)=4.336+6=10.336

    AICの第1項はモデルのあてはまりのよさ、第2項は変数の増加に伴うペナルティーを表し、AICは小さいほど望ましいといえます。

  • 寄与率
  • img src=
    LL0=(a)+(b)-(c)=-6.1827
    寄与率=(-2LL0-(-2LL))/(-2LL0)
       -2LL0=12.365、  -2LL=4.336
       =(12.365-4.336)÷12.365=8.029÷12.365=0.649
    寄与率が高いほど判別精度は良いといえます。

  • モデル適合情報

  • 検定統計量=-逸脱度-2k

    k=  


    ただし、 は群1、群2、全体の個体数
    k=4×log(4)+5×log(5)-9×log(9)
    =4×1.386+5×1.609-9×2.197=5.544+8.047-19.775=-6.183
    検定統計量=-4.336-2×(-6.183)=-4.336+12.368=8.029
    自由度=説明変数個数=2
    検定統計量は自由度2のカイ2乗分布に従います。

    カイ2乗分布における、検定統計量の上側確率p値を求めます。
    Excel関数 =CHIDIST(8.032,2) Enterキー → 0.0181
    p値=0.0181<0.05 より モデルは観測データの判別に適合していると判断できます
    検定統計量は自由度2のカイ2乗分布に従います。

    カイ2乗分布における、検定統計量の上側確率p値を求めます。
    Excel関数 =CHIDIST(8.032,2) Enterキー → 0.0181
    p値=0.0181<0.05 より モデルは観測データの判別に適合していると判断できます。
  • ピアソン残差
  •  目的変数1,0データと判別スコアの残差を算出します。
    img src=
    img src=
    img src=

     「計」の3.561をピアソン残差といいます。
       自由度=n-説明変数個数-1
          =9-2-1=6
      検定統計量は自由度2のカイ2乗分布に従います。
      カイ2乗分布における、検定統計量の上側確率p値を求めます。
      Excel関数 =CHIDIST(3.561,6) Enterキー → 0.736
      p値=0.0181>0.05 より モデルは観測データの判別に適合していると判断できます。
      ※ ピアソン残差の検定はp値>0.05で有意なので注意されたい
      ※ 逸脱度は自由度(n-説明変数の個数-1)のカイ2乗分布に従います。
        この検定の判定はp値<0.05で有意です。
  • Wald検定
  • 回帰係数の有意性を確認するために用いられる検定です。
    回帰係数を標準誤差で割ったものを2乗した値をWald–squareといいます。
    • 帰無仮説 回帰係数は0である。
    • 対立仮設 回帰係数は0でない。
    • 検定統計量 Wald–square=(回帰係数÷標準誤差 )2
    img src=

    検定統計量は自由度1のカイ二乗分布に従います。
    p値 Excelの関数「=CHIDIST(検定統計量,1)」で求められます。
    喫煙本数、飲酒日数いずれも、p値>0.05より、帰無仮説を棄却できず、
    対立仮設を採択できません。
    喫煙本数、飲酒日数の回帰係数はいずれも有意でなく、不整脈有無の判別に寄与しているといえません。


  • オッズ比からの寄与順位の把握
  • 説明変数のデータ単位が全て同じ場合はオッズ比は寄与順位に適用できます。
    データ単位が異なる場合、重回帰分析同様、回帰係数の単純比較はできません。
    (重回帰の場合は標準回帰係数で寄与順位をします。)
    Wald統計量は(回帰係数÷標準誤差)の2乗で検定統計量です。
    標準誤算で割ることによって基準化され、寄与順位に適用できます。


  • 信頼区間:Confidence Interval (CI)
  •   回帰係数CI 95% 下限値 b1=回帰係数-1.96×標準誤差
    上限値 b2=回帰係数+1.96×標準誤差
          オッズ比 95% 下限値= e 1
    上限値= e2

      99%CIは定数1.96を2,58として計算します。
      不健康有無の喫煙本数のオッズ比95%CIを求めます。
      回帰係数CI 95% 下限値 b1=0.3079-1.96×0.3099=-0.2994
    上限値 b2=0.3079+1.96×0.3099=0.9152
          オッズ比 95% 下限値= e-0.2994=0.7413
    上限値= e0.9152 =2.4973
      同様の計算で飲酒日数のオッズ比の95%CIを求めます。  
          オッズ比 95% 下限値=0.7038
    上限値=2.4231


    最新セミナー情報

    予測入門セミナー

    予測のための基礎知識、予測の仕方、予測解析手法の活用法・結果の見方を学びます。

    マーケティングプランニング&マーケティングリサーチ入門セミナー

    マーケティングリサーチを学ぶ上で基礎・基本からの調査のステップ、機能までをわかりやすく解説しています。

    統計解析入門セミナー

    統計学、解析手法の役割から種類、概要までを学びます。

    アンケート調査表作成・集計・解析入門セミナー

    調査票の作成方法、アンケートデータの集計方法、集計結果の見方・活用方法を学びます。