インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

分析

実は簡単! 10分あれば回帰分析ができます

回帰分析とはデータを用いた将来予測を行いたいときなどに活用される分析手法です。
(回帰分析については、こちらの記事も御覧ください
今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話し

 

例えば、既に複数店舗を展開しているパン屋のオーナーがいたとします。
彼は新しくA駅にお店を開こうと考えていますが、どれくらいの売り上げが見込めるのかが分からずに困っています。
駅を利用する人が多ければ多いほど売り上げが上がりそうという想像はつきますが、具体的な数字までは予想できないですよね。

そこで役に立つのが回帰分析。
回帰分析をすることで、すでに今ある他店舗の売上げとそれぞれの店舗に関するデータから、A駅に出店するとどれくらいの売上げが見込めるのかを具体的に予測することができます。
店舗に関する情報には年齢層、店の敷地面積など様々なものがありますが、今回は分かりやすい例として「最寄り駅の利用者数」と「売上」を用いた単回帰分析を行います。

また、Googleスプレッドシートを活用した単回帰分析の実施方法について紹介します。

単回帰分析とは

回帰分析にはいくつもの種類がありますが、今回は単回帰分析という最もシンプルな手法を取り扱いたいと思います。

単回帰分析とは1つの目的変数に対し、1つの説明変数を用いて、図示すると直線になる回帰式を求めることです。

(説明変数、目的変数、回帰式という言葉については、上記にあげたこちらの記事にて説明しています。よければ御覧ください:リンク

今回は先ほど例示したパン屋の売り上げという目的変数と、最寄り駅の利用者数という説明変数で、架空のデータを元にして下記のグラフを作成しました。

このグラフは散布図といい、横軸は1日の平均乗車人員、縦軸は1日の平均売上を示しています。

なお、散布図の作り方と見方については過去に解説しているので、こちらの記事を参考にしてみてください。

データの関係性がパッと見でわかる「散布図」

パッと見て、右肩上がりのグラフになっていることが分かると思います。しかしこの状態ではまだ、1日平均乗車人員と1日の平均売上との関係性を正確には知ることができません。

そこでこのグラフに回帰分析を用いて、このグラフに直線を引いた結果がこちら。

過去の実績データを元に直線が示されています。
また今回のこの回帰式は

1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413

となっています。

式として表せたことで、1日の平均乗車人員の数値を代入することで1日の平均売上を予測できるようになりました。例えば1日の平均乗車人員が50000人の駅があった場合、1日の平均売上は

1日の平均売上 = 0.506 × 50000 + 18413 = 43713

となり、1日で43713円くらいの売上が出そうと予測できるわけです。

回帰分析を実際に行ってみよう

さて、単回帰分析についての理解ができたと思うので、ここからは実際に手を動かしながら単回帰分析を行ってみましょう。

実は、紙とペンを用いて計算するのがとても大変な回帰分析なのですが、ツールを使うことであっという間に実施することが可能です。

今回はこちらの表を使用し、Googleのスプレッドシートで行います。

この表は、上述の散布図と同じデータになります。

1日平均乗車人員 1日の平均売上
789366 407557
370856 309041
566994 289068
281971 133063
188170 113090
147699 112910
252267 92577
141351 88798
173003 87856
105669 75573

 

まずはこちらの表を選択してコピーし、スプレッドシートに貼り付けてください。

次に貼り付けた表全体を選択し、「挿入ボタン」から「グラフ」を押してください。

すると散布図が作成されます。

次にこちらのグラフを右クリックし、「系列」から「1日の平均売上」を選択してみてください。

すると下記のような画面が表示されるので、「トレンドライン」にチェックを入れ、「ラベル」で「方程式を使用」を選択します。

下のグラフが表示されていれば完成です。

グラフの上部に回帰式が表示されています。今回の単回帰分析では、1日の平均売上と平均乗車人員の関係は

1日の平均売上 = 0.506 × 1日の平均乗車人員 + 18413

という直線で表すことができると分かりました。またこの式により1日の乗車人員が10万人増えると1日の平均売上が50600円増えるなど、新しくお店を開く際にどれくらいの売り上げが見込めるのか具体的な数字を算出することができるようになりました。

いかがだったでしょうか? 一見難しそうな回帰分析ですが(そして実際に手で計算しようとすると非常に面倒くさくて難しいのですが)、Googleスプレッドシートを使えば簡単にできるということが分かったことと思います。

今回はGoogleスプレッドシートを使ってパン屋の売上を説明する回帰分析に挑戦してみました。

簡単にできたと思いますが、残念ながら、説明変数が複数になる重回帰分析や、複雑な回帰分析を行う場合は今回の方法を使うことができないのでご注意ください。

さて、書き手である私が所属するかっこ株式会社には、回帰分析をはじめとした様々な分析手法に精通したデータサイエンティストが在籍しております。お客様のご相談に合わせて分析手法を使い分け、問題を解決するためのアクションまでご提案しています。

「データはあるけど、どう分析したら良いか分からない」という方が、

最初のデータ分析で成果をあげるのに最適な、「さきがけKPI」というお手軽なコストのサービスも用意しているので、ぜひ、お問い合わせください。

さきがけKPI

ピックアップ記事

  1. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  2. こんなときには異常検知
  3. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  4. 知っておきたいAIの理想と現実
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. 分析

    今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話し

    経営判断や、次のアクションを決める必要があるときに、「どんな要素が」「…

  2. ECサイトのリピート率を向上させる方法のアイキャッチ画像

    分析

    コストを抑えてECサイトのリピート率を向上させる9つの方法【手順付き】

    「コストを抑えてECサイトのリピート率を上げられる?」「そもそも、…

  3. 分析

    かんたん解説! ロジスティック回帰の結果の見方と考え方

     統計学の心得が無いビジネスマンにも、分析結果の読み方が理解できれば、…

  4. リピート率とはのアイキャッチ画像

    分析

    売上に直結するリピート率とは?計算方法や上げ方の手順を解説

    「リピート率ってなに?」「そもそもなんでリピート率が重要?…

  5. 分析

    それ分析じゃなく集計ですから

    データ分析に取り組んでいるけど、まるで成果が上がらない、こんなことやっ…

  6. 分析

    サブスクリプションの利用継続KPIをロジステック回帰分析で明らかに!

    本記事ではロジスティック回帰分析でできることと、効能について、具体的な…

おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. インターン体験記

    データサイエンス専門外の学生も挑戦できるインターン
  2. 統計

    こんなにも使える、単純集計とクロス集計の活用法
  3. 分析環境

    大きなデータを安全・便利にやり取りできるAmazonのクラウドストレージ活用法
  4. リピート率とはのアイキャッチ画像

    分析

    売上に直結するリピート率とは?計算方法や上げ方の手順を解説
  5. 用語解説

    Pythonとは?3分で分かる人気の理由と基礎知識
PAGE TOP