事例

株式会社アイスタット(統計分析研究所)は、統計学 を礎とした情報サービス業 に従事しています。 

予測の事例

売上予測モデル式作成、予測値算出

 医療機器メーカーの担当者から、「製品告知のための広告費、お客様からの資料請求件数、マーケティング施策有無から自社の医療機器販売台数を予測したい」という相談を受けました。広告費や資料請求件数は量的データ、マーケティング施策はモデルチェンジ、展示場出展などの質的データ(カテゴリーデータ)です。このように量的、質的のデータが混在していても予測モデル式が作成できるのか、作成できるとすれば以下の条件に示す将来設定で 1 年先の予測値を教えてほしいという相談でした。

適用データとグラフ

適用する解析手法

拡張型数量化1類
※クリックすると「拡張型数量化1類」の解説ページに移動します。

分析

相関分析により売上規定要因の検討
広告費、資料請求件数、マーケティング施策が医療機器販売台数を予測するのに重要な要因であるかを時系列相関係数で調べました。
 時系列相関係数は基準としている 0.2 を上回ったので、広告費、資料請求件数、マーケティング施策が医療機器販売台数を予測するのに重要な要因と判断しました。(右上表参照)

注 . 質的データは時系列相関係数が算出できないので、マーケティング施策を右下表のように得点化して時系列相関係数を算出しました。
 説明変数の個数は、時系列相関が 0.2 以上であればいくつ用いてもかいません。ただし、説明変数相互の時系列相関が高い(0.5 以上)場合、これらの項目から 1 つだけを用いるというルールがあります。選ぶのは目的変数との時系列相関が最も高いものとします。
 このルールを守らず予測モデル式を作成した場合、正しくないモデル式が導かれます。
右表は目的変数と説明変数の総数 6 変数相互の時系列相関を示したものです。 x2 と x3 との時系列相関は 0.6 で 0.5 より大きいので、両方適用できません。 目的変数との時系列相関をみると、x3 より x2 の方が高いので x2 を用います。 したがって、説明変数は x1、x2、x4、x5 の 4 つです。
医療機器販売台数の季節変動指数Sの作成
EPA法※によって季節変動指数Sを算出しました。また、Sの予測値はEPA法によって算出された予測値を適用しました。季節変動指数Sは下表で示します。
※クリックすると解説ページに移動します。
医療機器販売台数のトレンドTの作成
EPA法※によって医療機器販売台数のTCを算出し、TCに回帰分析を行い、トレンドTを求めました。トレンドTは下表で示します。
※クリックすると解説ページに移動します。
◆季節変動指数S
◆トレンドT
予測モデル式

 医療機器販売台数を目的変数、トレンドT,季節変動指数S、広告費、資料請求件数、マーケティング施策を説明変数として拡張型 1 類を行い、予測モデル式を作成します。

注 . 拡張型 1 類は、説明変数が量的データと質的データが混在しているときに予測モデル式を作成する方法です。
実績期間を予測(理論値)

予測モデル式に説明変数のデータを代入し実績期間の予測値(理論値)を算出します。
医療機器販売台数の実績値と理論値の比較グラフを作成しました。
予測モデル式の精度

 実績値と理論値はほぼ一致し、予測モデル式は予測に使えそうです。実績値と理論値の一致度を決定係数で調べました。決定係数は 0.9168 で基準の 0.5 を上回っているので予測モデル式は予測に適用できると判断しました。

決定係数0.9168
予測

 説明変数の将来値を予測モデル式に代入し 12ヶ月先までを予測しました。
 2014 年 3 月を例として予測値算出の手順を右表に示します。
◆2014年3月の予測値算出手順
2014 年3 月の予測値は148 台です。2014 年1 月以降の予測値を以下に示します。
◆予測値

分析結果

 医療機器販売台数は2012 年に欠陥品が発生し雑誌記事で悪評価されるなどで低迷した。
 2013 年のモデルチェンジが好評を得たことにより上昇基調に転じた。
 2014 年は、3 月のモデルチェンジ、7 月の展示会出展が成功することを想定すると、2013年同様の上昇基調が続くであろう。
<留意点>
 広告費別、資料請求件数別、マーケティング施策有無別の医療機器販売台数の平均値を算出しました。広告費が多いほど、資料請求件数が多いほど医療機器販売台数が大きくなるという傾向が見られません。
◆分類別の医療機器販売台数の平均値
注. 図3.26 はソフトウェア「マルチ予測」で算出したものです。カテゴリー名における階級幅は、例えば「90〜100」は、90 < 広告費 ≦ 100 のことです。


 これは「時系列データの相関は単相関では把握できず、時系列相関で把握しなければならない」ということと同じ理由です。

 拡張型数量化1 類は予測モデル式の係数とは別に「カテゴリースコア」という値を算出します。
カテゴリースコアは、季節変動や不規則変動を除去した医療機器販売台数について平均値を算出し、求められた平均値から医療機器販売台数全体平均(この例は55.6 台)を引いた値です。
 カテゴリースコアから、広告費の金額が多いほど医療機器販売台数も多くなる傾向が明確となります。さらに、例えば広告費を110 万円以上にすると、医療機器販売台数は平均的な月の販売台数55.6 台より37.6 台多くなるといったことがわかります。
 資料請求件数は広告費で見られたほどの傾向ではありませんが、資料請求件数が多いほど医療機器販売台数が多くなる傾向が見られます。広告費同様に、例えば資料請求件数が125 件以上であると医療機器販売台数は平均的な月の販売台数55.6 台より3.0 台多くなるといったことがわかります。
 マーケティング施策では、良い影響のある施策をすると6.7 台が増加し、悪い影響のできことがあると9.7 台が減少するといったことがわかります。

↑クリックすると展開します。

営業活動と売上額の相関分析、営業活動成果検証

 製薬会社の市場調査部担当者から相談を受けたテーマです。我が社の主力製品A薬剤の売上は、ここ数年減少傾向にあります。減少の理由はいろいろ考えられますが、競合薬剤の市場シェアが増加していること、A薬剤の営業回数が少ないこと、医師へのA薬剤製品説明会の効果があまりないことなどが考えられます。
 このことを統計学的に説明できる方法がないか、またこれらの要因は売上を予測するのに重要な要因となり得るかを教えてほしいという相談です。

適用データとグラフ

適用する解析手法

時系列相関タイムラグ関数
※クリックすると解説ページに移動します。

分析

 A 薬剤の売上は減少傾向、競合薬剤のシェアは増加傾向で推移しています。競合薬剤の増加に伴い、A 薬剤の売上が減少していると考えられます。両者の関係を時系列相関で見ると、- 0.5849 となりました。時系列相関の絶対値0.5849 は基準としている0.2 を上回ったので、競合薬剤のシェア増加はA 薬剤の売上減少に影響を及ぼしているといえます。
 A 薬剤の営業回数は2012 年3 月に大きく減少しましたが、それ以降少しずつ増やしているものの、2013 年末現在において2011 年の水準には達していません。そのような状況でも営業回数が多い月はA 薬剤の売上は増加する傾向が見られます。両者の関係を時系列相関で見ると0.2960 となり、基準としている0.2 を上回ったので、営業回数の増減はA 薬剤の増減に影響を及ぼしているといえます。
 A 薬剤の売上とA 薬剤製品説明会との関係を時系列相関で調べました。時系列相関の値は0.1157 で基準の0.2 を下回り、製品説明会をしても売上増につながらないということがわかりました。
注. 時系列相関はトレンドTの影響を除去した時系列データ相互の関係を見る方法です。

 一生懸命営業しても、その効果(売上増)はその月に現れるとは限りません。もしかしたら効果は1ヶ月後、あるいは2ヶ月後かもしれません。
 売上と営業回数との関係を、月数をずらして見る相関を「タイムラグ相関」といいます。
 タイムラグ相関もトレンドTの影響を除去した時系列データ相互の関係を見ることができます。この相関を「タイムラグ時系列相関」といいます。
運用データのついて時系列タイムラグ関数を算出しました。

 タイムラグ1ヶ月の時系列相関係数は0.4366 と0ヶ月の0.2960 より高く、A 薬剤営業回数の効果は1ヶ月後に現れることがわかりました。
 競合薬剤シェア、A 薬剤製品説明会の時系列タイムラグ相関を算出しましたが、0ヶ月の相関が最大でした。
◆競合薬剤シェア
◆A薬剤製品説明会
↑クリックすると展開します。

分析結果

 A 薬剤の売上を予測するのに競合薬剤シェア、A 薬剤営業回数は欠かせない要因であることがわかりました。A 薬剤製品説明会は重要でありませんでした。
 A 薬剤の売上予測モデル式を作成する際、A 薬剤営業回数はタイムラグ1ヶ月を考慮することを重要事項として記しておきます。

↑クリックすると展開します。

施設別売上ポテンシャル算出モデル式作成、施設評価

 製薬会社の市場調査部の担当者からの相談です。MR(医薬情報提供者)が医師に面会し、B 薬剤の医薬情報を提供しています。「MR 面会回数」は医師に面会した回数 を、施設ごとに数えた延べ回数です。 
 インターネットによってA 薬剤の医薬情報提供を、医師に配信するサービスをしている 会社があります。「医師視聴人数」はそのサービスを視聴している医師を、施設ごとに数え た延べ人数です。
  製薬会社はB 薬剤を処方採用・増量してもらいたいと考えている施設をターゲット施設、そうでない施設をノンターゲット施設としています。
  400 の施設(病院・医院・診療所)について、B 薬剤売上及び伸長率、MR 面会回数、医師視聴人数、ターゲット施設有無のデータがあります。
  これらのデータを解析し、次の3 つを明らかにしたいという相談です。

 ① MR 面会回数が多い施設ほど、医師視聴人数が多い施設ほど売上伸長率は高いか。ターゲット施設はノンターゲット施設に比べ売上伸長率は高いか。 
② MR 面会回数、医師視聴人数、ターゲット施設有無から、施設ごとの売上伸長率を予測するモデル式を作成したいがどうすれば良いか。 
③ MR 活動とインターネットとを組み合わせて営業をした場合、どのような配分で営業をすれば売上伸長率を高くすることができるか。

適用データ

適用する解析手法

基本統計量と度数分布、単相関係数、カテゴリー別平均、拡張型数量化1類
※クリックすると解説ページに移動します。

分析

B 薬剤の売上と売上伸長率の現状

 施設別の売上額の基本統計量と分布を調べました。
 全施設の2013 年の売上平均値は1,737 万円です。売上額の分布を見ると501~1000 万円以下の施設が最も多く、501~2500 万円以下の施設で7 割を占めます。
 次に、施設別の売上伸長率の基本統計量と分布を調べました。
 全施設の2013 年対前年の売上伸長率は24.9%です。売上伸長率の分布を見ると0~10%以下の施設が最多。0%以下(減少)の施設は4%、50%以上伸びた施設はほぼ1 割ありました。
◆2013 年売上の基本統計量と分布
◆2013年対2012年売上伸長率の基本統計量と分布
売上規定要因の現状

 MR 面会回数の平均値は511 回/1 施設です。200 回以下の施設は27%、701 回以上は24%でした。医師視聴人数の平均値は5.1 人/1 施設です。未視聴(0 人)施設は42%、11 人以上の施設は16%でした。ターゲット施設は25%です。
◆2013 年データの基本統計量と分布
B 薬剤の売上伸長率と売上規定要因との関係

薬剤の売上伸長率と売上規定要因との関係をカテゴリー別平均で調べました。
 ・MR 面会回数が多い施設ほど売上伸長率は高くなる傾向がみられました。
 ・医師視聴人数が多い施設ほど売上伸長率は高くなる傾向がみられました。
 ・ターゲット施設はノンターゲット施設に比べ売上伸長率は高い値を示しました。
 ・ 売上伸長率との単相関係数を見ると、MR 面会回数、ターゲット施設は0.3 を上回りましたが、医師視聴人数は0.25 と0.3 をやや下回りました。
 ・ 医師視聴人数は弱い相関係数でしたが、これら3 つの項目は予測するのに重要な要因と判断しました。
◆カテゴリー別平均
◆単相関係数
予測モデル式

 B 薬剤売上伸長率を目的変数、MR 面会回数、医師視聴人数、ターゲット施設有無を説明変数として拡張型数量化1 類を行いました。拡張型数量化1 類より求められた関係式を施設別のB薬剤の売上伸長率を予測するモデル式としました。以下、予測モデル式の結果を示します。
実績期間を予測(理論値)

 400 施設の説明変数のデータを予測モデル式に代入し、400 施設の売上伸長率の予測値(理論値)を算出します。
 実績値を縦軸、理論値を横軸に散布図を描いてみると、実績値と理論値はほぼ一致していることがわかり、予測モデル式は予測に使えそうです。
予測モデル式の精度

 実績値と理論値の一致度を決定係数で調べました。決定係数は0.8838 で基準の0.5 を上回っているので、予測モデル式は予測に適用できると判断しました。
予測

 MR 面会回数が500 回、300 回、0 回の場合、医師視聴人数が8 人、4 人、0 人の場合、ターゲット施設がある場合、ない場合の組み合わせを以下の18 のパターンを設定しました。
18パターンを予測モデル式に代入し予測値を算出しました。
 当然ながら、MR 面会回数、医師視聴人数が多いパターンほど売上伸長率は高くなります。だからといって、それぞれを多くすれば経費が嵩みます。そこで経費の上限を決め、その経費内に収まり売上伸長率が最も高いパターンを見出します。

分析結果

 ①「 MR面会回数が多い施設ほど、医師視聴人数が多い施設ほど売上伸長率は高い」、「ターゲット施設はノンターゲット施設に比べ売上伸長率は高い」といえます。

 ② MR 面会回数、医師視聴人数、ターゲット施設有無から、施設ごとの売上伸長率を予測するモデル式は、以下の式となります。決定係数は0.8838 で予測に適用できます。



 ③ 経費の関係でターゲット施設に対しては、MR 面会活動300 回、医師視聴人数8 回としたとします。その設定で見込める売上伸長率は44.8%です。

↑クリックすると展開します。

多変量解析の事例

準備中です

アンケート調査の事例

準備中です