分析

実は簡単! 10分あれば回帰分析ができます

回帰分析とはデータを用いた将来予測を行いたいときなどに活用される分析手法です。
(回帰分析については、こちらの記事も御覧ください
今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話し

 

例えば、既に複数店舗を展開しているパン屋のオーナーがいたとします。
彼は新しくA駅にお店を開こうと考えていますが、どれくらいの売り上げが見込めるのかが分からずに困っています。
駅を利用する人が多ければ多いほど売り上げが上がりそうという想像はつきますが、具体的な数字までは予想できないですよね。

そこで役に立つのが回帰分析。
回帰分析をすることで、すでに今ある他店舗の売上げとそれぞれの店舗に関するデータから、A駅に出店するとどれくらいの売上げが見込めるのかを具体的に予測することができます。
店舗に関する情報には年齢層、店の敷地面積など様々なものがありますが、今回は分かりやすい例として「最寄り駅の利用者数」と「売上」を用いた単回帰分析を行います。

また、Googleスプレッドシートを活用した単回帰分析の実施方法について紹介します。

単回帰分析とは

回帰分析にはいくつもの種類がありますが、今回は単回帰分析という最もシンプルな手法を取り扱いたいと思います。

単回帰分析とは1つの目的変数に対し、1つの説明変数を用いて、図示すると直線になる回帰式を求めることです。

(説明変数、目的変数、回帰式という言葉については、上記にあげたこちらの記事にて説明しています。よければ御覧ください:リンク)

今回は先ほど例示したパン屋の売り上げという目的変数と、最寄り駅の利用者数という説明変数で、架空のデータを元にして下記のグラフを作成しました。

このグラフは散布図といい、横軸は1日の平均乗車人員、縦軸は1日の平均売上を示しています。

なお、散布図の作り方と見方については過去に解説しているので、こちらの記事を参考にしてみてください。

データの関係性がパッと見でわかる「散布図」

パッと見て、右肩上がりのグラフになっていることが分かると思います。しかしこの状態ではまだ、1日平均乗車人員と1日の平均売上との関係性を正確には知ることができません。

そこでこのグラフに回帰分析を用いて、このグラフに直線を引いた結果がこちら。

過去の実績データを元に直線が示されています。
また今回のこの回帰式は

1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413

となっています。

式として表せたことで、1日の平均乗車人員の数値を代入することで1日の平均売上を予測できるようになりました。例えば1日の平均乗車人員が50000人の駅があった場合、1日の平均売上は

1日の平均売上 = 0.506 × 50000 + 18413 = 43713

となり、1日で43713円くらいの売上が出そうと予測できるわけです。

回帰分析を実際に行ってみよう

さて、単回帰分析についての理解ができたと思うので、ここからは実際に手を動かしながら単回帰分析を行ってみましょう。

実は、紙とペンを用いて計算するのがとても大変な回帰分析なのですが、ツールを使うことであっという間に実施することが可能です。

今回はこちらの表を使用し、Googleのスプレッドシートで行います。

この表は、上述の散布図と同じデータになります。

1日平均乗車人員 1日の平均売上
789366 407557
370856 309041
566994 289068
281971 133063
188170 113090
147699 112910
252267 92577
141351 88798
173003 87856
105669 75573

 

まずはこちらの表を選択してコピーし、スプレッドシートに貼り付けてください。

次に貼り付けた表全体を選択し、「挿入ボタン」から「グラフ」を押してください。

すると散布図が作成されます。

次にこちらのグラフを右クリックし、「系列」から「1日の平均売上」を選択してみてください。

すると下記のような画面が表示されるので、「トレンドライン」にチェックを入れ、「ラベル」で「方程式を使用」を選択します。

下のグラフが表示されていれば完成です。

グラフの上部に回帰式が表示されています。今回の単回帰分析では、1日の平均売上と平均乗車人員の関係は

1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413

という直線で表すことができると分かりました。またこの式により1日の乗車人員が10万人増えると1日の平均売上が50600円増えるなど、新しくお店を開く際にどれくらいの売り上げが見込めるのか具体的な数字を算出することができるようになりました。

いかがだったでしょうか? 一見難しそうな回帰分析ですが(そして実際に手で計算しようとすると非常に面倒くさくて難しいのですが)、Googleスプレッドシートを使えば簡単にできるということが分かったことと思います。

今回はGoogleスプレッドシートを使ってパン屋の売上を説明する回帰分析に挑戦してみました。

簡単にできたと思いますが、残念ながら、説明変数が複数になる重回帰分析や、複雑な回帰分析を行う場合は今回の方法を使うことができないのでご注意ください。

さて、書き手である私が所属するかっこ株式会社には、回帰分析をはじめとした様々な分析手法に精通したデータサイエンティストが在籍しております。お客様のご相談に合わせて分析手法を使い分け、問題を解決するためのアクションまでご提案しています。

「データはあるけど、どう分析したら良いか分からない」という方が、

最初のデータ分析で成果をあげるのに最適な、「さきがけKPI」というお手軽なコストのサービスも用意しているので、ぜひ、お問い合わせください。

さきがけKPI

ピックアップ記事

  1. 優良顧客を見つける「RFM分析」の考え方と使い方
  2. 知っておきたいAIの理想と現実
  3. こんなときには異常検知
  4. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. 分析

    今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話し

    経営判断や、次のアクションを決める必要があるときに、「どんな要素が」「…

  2. 分析

    サブスクリプションの利用継続KPIをロジステック回帰分析で明らかに!

    本記事ではロジスティック回帰分析でできることと、効能について、具体的な…

  3. 分析

    マーケティングから不正検知まで、データの理解と意思決定を助けてくれる「クラスタリング」とは?

    クラスタという言葉そのものには聞き覚えがあるかもしれません。で…

  4. 分析

    まずはやってみよう!マーケティングでデータ分析!①イントロダクション

    まずは自社でデータ分析をやるべきデータ分析を会社で活かせていますか…

  5. 分析

    まずはやってみよう!マーケティングでデータ分析!②必要なデータと基礎集計

    必要なデータは5つだけ!早速、今回の記事からマーケティングでデータ…

  6. 分析

    データ分析の使える道具!! よく活用する図表・グラフをまとめてみた。

    データ分析において、変数1つ1つの特徴や、変数間の関係性、現状の把握を…

カテゴリー

おすすめ記事

  1. 確率を予測する「ロジスティック回帰」とは
  2. データサイエンスを現場の敵にしないために
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. 箱ひげ図 について超カンタンに解説してみた
  5. 知っておきたいAIの理想と現実
  1. topics

    大阪のホテル相場は1泊4500円。条件の違いで相場がどれだけ変わるのか見える化し…
  2. 最適化

    人間の経験と勘を越える「数理最適化」で、製造業の生産計画から、ひとを解放したお話…
  3. topics

    多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  4. topics

    湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた
  5. 機械学習

    知っておきたいAIの理想と現実
PAGE TOP