回帰分析とはデータを用いた将来予測を行いたいときなどに活用される分析手法です。
(回帰分析については、こちらの記事も御覧ください
今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話し)
例えば、既に複数店舗を展開しているパン屋のオーナーがいたとします。
彼は新しくA駅にお店を開こうと考えていますが、どれくらいの売り上げが見込めるのかが分からずに困っています。
駅を利用する人が多ければ多いほど売り上げが上がりそうという想像はつきますが、具体的な数字までは予想できないですよね。
そこで役に立つのが回帰分析。
回帰分析をすることで、すでに今ある他店舗の売上げとそれぞれの店舗に関するデータから、A駅に出店するとどれくらいの売上げが見込めるのかを具体的に予測することができます。
店舗に関する情報には年齢層、店の敷地面積など様々なものがありますが、今回は分かりやすい例として「最寄り駅の利用者数」と「売上」を用いた単回帰分析を行います。
また、Googleスプレッドシートを活用した単回帰分析の実施方法について紹介します。
単回帰分析とは
回帰分析にはいくつもの種類がありますが、今回は単回帰分析という最もシンプルな手法を取り扱いたいと思います。
単回帰分析とは1つの目的変数に対し、1つの説明変数を用いて、図示すると直線になる回帰式を求めることです。
(説明変数、目的変数、回帰式という言葉については、上記にあげたこちらの記事にて説明しています。よければ御覧ください:リンク)
今回は先ほど例示したパン屋の売り上げという目的変数と、最寄り駅の利用者数という説明変数で、架空のデータを元にして下記のグラフを作成しました。
このグラフは散布図といい、横軸は1日の平均乗車人員、縦軸は1日の平均売上を示しています。
なお、散布図の作り方と見方については過去に解説しているので、こちらの記事を参考にしてみてください。
パッと見て、右肩上がりのグラフになっていることが分かると思います。しかしこの状態ではまだ、1日平均乗車人員と1日の平均売上との関係性を正確には知ることができません。
そこでこのグラフに回帰分析を用いて、このグラフに直線を引いた結果がこちら。
過去の実績データを元に直線が示されています。
また今回のこの回帰式は
1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413
となっています。
式として表せたことで、1日の平均乗車人員の数値を代入することで1日の平均売上を予測できるようになりました。例えば1日の平均乗車人員が50000人の駅があった場合、1日の平均売上は
1日の平均売上 = 0.506 × 50000 + 18413 = 43713
となり、1日で43713円くらいの売上が出そうと予測できるわけです。
回帰分析を実際に行ってみよう
さて、単回帰分析についての理解ができたと思うので、ここからは実際に手を動かしながら単回帰分析を行ってみましょう。
実は、紙とペンを用いて計算するのがとても大変な回帰分析なのですが、ツールを使うことであっという間に実施することが可能です。
今回はこちらの表を使用し、Googleのスプレッドシートで行います。
この表は、上述の散布図と同じデータになります。
1日平均乗車人員 | 1日の平均売上 |
789366 | 407557 |
370856 | 309041 |
566994 | 289068 |
281971 | 133063 |
188170 | 113090 |
147699 | 112910 |
252267 | 92577 |
141351 | 88798 |
173003 | 87856 |
105669 | 75573 |
まずはこちらの表を選択してコピーし、スプレッドシートに貼り付けてください。
次に貼り付けた表全体を選択し、「挿入ボタン」から「グラフ」を押してください。
すると散布図が作成されます。
次にこちらのグラフを右クリックし、「系列」から「1日の平均売上」を選択してみてください。
すると下記のような画面が表示されるので、「トレンドライン」にチェックを入れ、「ラベル」で「方程式を使用」を選択します。
下のグラフが表示されていれば完成です。
グラフの上部に回帰式が表示されています。今回の単回帰分析では、1日の平均売上と平均乗車人員の関係は
1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413
という直線で表すことができると分かりました。またこの式により1日の乗車人員が10万人増えると1日の平均売上が50600円増えるなど、新しくお店を開く際にどれくらいの売り上げが見込めるのか具体的な数字を算出することができるようになりました。
いかがだったでしょうか? 一見難しそうな回帰分析ですが(そして実際に手で計算しようとすると非常に面倒くさくて難しいのですが)、Googleスプレッドシートを使えば簡単にできるということが分かったことと思います。
今回はGoogleスプレッドシートを使ってパン屋の売上を説明する回帰分析に挑戦してみました。
簡単にできたと思いますが、残念ながら、説明変数が複数になる重回帰分析や、複雑な回帰分析を行う場合は今回の方法を使うことができないのでご注意ください。
さて、書き手である私が所属するかっこ株式会社には、回帰分析をはじめとした様々な分析手法に精通したデータサイエンティストが在籍しております。お客様のご相談に合わせて分析手法を使い分け、問題を解決するためのアクションまでご提案しています。
「データはあるけど、どう分析したら良いか分からない」という方が、
最初のデータ分析で成果をあげるのに最適な、「さきがけKPI」というお手軽なコストのサービスも用意しているので、ぜひ、お問い合わせください。
