《拡張型数量化1類(2/2) 》

4. 拡張型数量化1類の結果の見方、活用方法 

カテゴリースコアー、アイテムスコアの解釈


カテゴリースコアは、学習方法によって得点増分がどれだけ高まる(低まる)かを把握できる数値です。例えば学習方法5は得点平均16.5点から1.883点高まる、学習方法1は2.155点低まると解釈できます。
アイテムスコアは単位価値を表すので、学習時間1時間当り得点増分は0.16点高まると解釈できます。

予測モデル式

 拡張型数量化1類における目的変数を予測する式を示します。
 Y={a₁₁X₁₁+a₁₂X₁₂+a₁₃X₁₃+a₁₄X₁₄+a₁₅X₁₅}+a₂X₂+a₀
 a₁₁~a₁₅はカテゴリースコア、a₂はアイテムスコア、a₀は定数項を示します。
  定数項a₀は得点増分の平均値で与えられます。
 この例の予測式は次式となります。
サンプルスコア

 予測モデル式に[1,0]データと偏差データを代入してサンプルスコアを求めます。
決定係数
 求められたサンプルスコアと得点増分との一致度を決定係数で調べると、決定係数は0.8377で0.5を上回り予測に適用できると判断します。


予測
 学習方法が5で学習時間が123時間の生徒A、学習方法が5で学習時間が130時間の生徒Bについて、得点増分を予測することにします。


5. 拡張型数量化1類と数量化1類の比較

 この例題にについて数量化1類を行います。1類は説明変数がカテゴリーデータでなければならないので、学習時間を次の示すカテゴリーデータに変換してから行います。

決定係数

 求められたサンプルスコアと得点増分との一致度を決定係数で調べると、決定係数は0.8377で0.5を上回り予測に適用できると判断します。
数量化1類で導いた予測モデル式で、前で示した生徒Aと生徒Bについて予測します。

* 学習方法5、学習時間が123時間はカテゴリー4
   Y={-2.002×0-0.626×0-0.317×0+1.293×0+1.883×1}
    +{-4.185×0-0.562×0+2.507×0+2.941×1}+16.5=21.3
    Aの得点増分は21.3時間

* 生徒Bの学習時間は130時間ですがカテゴリー4なので、予測時間は生徒Aと同じ21.3時間です。

 数量化1類の場合、学習時間が123時間であろうと130時間であろうと予測結果は同じになります。
 拡張型数量化1類は数量化1類に比べ、数量データをカテゴリー化しないだけ、きめ細かい予測ができるといえます。

6. 回帰分析を導入した拡張型数量化1類

 回帰分析の節で得点増分と学習時間との関係との関係を示しました。再掲すると、「学習時間が長くなればそれにともない成績は上がるが、その伸びは鈍化傾向にある」、そして、「回帰式は直線式より、分数式の方がよい」ということでした。

分数式の当てはまりがよいといえるので学習時間のデータを分数変換します。データをxとすると、X=1/xのデータを求め、Xの偏差データを作成します。

このデータと学習方法の1,0データを説明変数にして重回帰分析を行い、予測モデル式を導きます。
学習時間は数量データなので重回帰分析の係数をそのまま、方法1~5の係数は、カテゴリースコアの算出方法を参考にカテゴリースコアを算出します。



決定係数を求めます。決定係数は0.8637で前の0.8377を上回りました。学習時間を分数変換したことによって予測モデル式の精度は上がりました。
 拡張型数量化1類を行う前に、数量データの説明変数に回帰分析を行い、直線関数、分数関数、対数関数、ルート関数など、最も当てはまりのよい関数式を定めます。定めた関数式で変換したデータを説明変数として、拡張型数量化1類を行いましょう。