本記事ではロジスティック回帰分析でできることと、効能について、具体的なビジネスのケースを使って紹介していきます。
- ロジスティック回帰分析で、サブスクリプションの初月のKPIが得られた
- 分析は、ビジネスで「どう使うか」を中心に考えることが大事
- たとえビジネスアクションに寄与する結果が得られずとも、新たな仮説を与えてくれる
はじめに
今回は、最近、話題のサブスクリプション(月額制使い放題サービス)を分析のケースとして、とりあげてみます。
サブスクリプションのサービスは、まず利用を体験してメリットを実感してもらえるよう、初月はユーザーに無料で提供されていることが、よくあります。
この場合、収益化出来るのは、有料でサービスを使ってもらえる2カ月目以降になるので、「新規会員を初月で離脱させない」ことが、非常に重要です。
ロジスティック回帰分析を使うと、『どんな会員が、あるいはどういった使い方が、1ヶ月継続の確率にどのように影響しているか』が明らかになります
つまり、獲得すべき会員像として、どんなユーザーにフォーカスすればいいのかや、新規会員にどんな体験を提供すると、勝ちパターンを作ることが出来るのか、確率に基づいた作戦を立案出来るのです。
では、実際にやってみましょう
データの紹介
今回は映画のサブスクリプションを題材とします。扱うデータは、「会員ID、会員の年齢、性別、視聴した映画の本数、視聴した映画のカテゴリ(ジャンル)、1ヶ月継続の有無」の6つを用意しました。
ここで、「年齢」、「性別」、「初月の映画視聴本数」、「どんなカテゴリをどれだけみたか」を使って、2ヶ月目への継続が維持されるかを分析してみましょう。
結果
では結果を見ていきましょう。(結果の見方についてちゃんと理解したい方はこちらの記事をご覧ください。)
ロジスティック回帰ではこのように結果が得られます。
ここでわかったことは、継続に関するポジティブな因子として、特に、映画の視聴本数や、いくつかの映画のカテゴリが強く影響することがわかりました。
変数 | 回帰係数(変数が1変化した時に及ぼす影響の程度) | Z値(変数に対する信頼度) | p値(変数の説明効力) | 変数が1増加した時のオッズ比 |
y切片 | 0.3 | 1.5 | 0.14 | 4.7 |
映画視聴本数 | 0.5 | 11.1 | 0.00 | 1.7 |
Category_K | 1.5 | 8.0 | 0.00 | 4.7 |
Category_D | 1.9 | 6.4 | 0.00 | 6.4 |
Category_B | 1.2 | 5.2 | 0.00 | 3.4 |
Category_C | 1.0 | 4.3 | 0.00 | 2.6 |
Category_J | 2.5 | 4.3 | 0.00 | 11.8 |
Category_I | 1.1 | 3.5 | 0.00 | 3.0 |
Category_A | 1.8 | 3.4 | 0.00 | 5.8 |
Category_F | 0.7 | 3.3 | 0.00 | 2.0 |
Category_E | 1.7 | 3.2 | 0.00 | 5.6 |
Category_H | 2.0 | 2.9 | 0.00 | 7.5 |
Category_G | 0.3 | 1.2 | 0.21 | 1.3 |
年齢 | 0.0 | 1.0 | 0.31 | 1.0 |
性別_男 | -0.3 | -1.6 | 0.12 | 0.8 |
映画を見ているほど継続率が高いというのは、要は「見放題サービス」をちゃんと使っていることを説明していますよね。
また、カテゴリーの結果は、作品の本数が満たされているかや、会員が望んでいるものを提供できているかなどを評価する指標に、なり得ます。
今回の分析では、特に、あるカテゴリを好んで見るユーザーに対して高い継続率を得やすいことがわかりました。
直感的に、「たくさん見てくれる」ユーザーは、継続してくれそうだとイメージできます。
しかし、たくさんとは、具体的に、どれだけの本数なのか?を、感覚ではなく、数値で説明し、ビジネスにおけるインパクトが測れるようになることは、ビジネスを加速させるうえでの必要アクションを具体的なものにしてくれます。
経営的には、これは大きな意味を持つのです。
ビジネスアクションに落とし込もう
つまり、大事なのは分析結果をビジネスアクションに落とし込むことなのです。
先程の結果で言えることは
「映画視聴本数」と「Category_Kの視聴割合」は特に継続に貢献するということ、またその影響の程度を確認できました。でも、ビジネスアクションにするならこれだけじゃ足りないですよね。
そこで、それぞれのデータごとに分布を確認しましょう。
映画視聴本数
映画の視聴本数別に離脱と継続の会員のボリューム及び継続率をまとめました。
これをみると、月の視聴本数が4本以上を満たしたとき、継続率が80%を越えることが読み取れます。
これは初月継続に対するKPIととらえることができます。
なので、特に視聴本数が0〜3本の会員について、まず4本みてもらうように促すことが喫緊のアクションになりそうです。
Category_Kの視聴割合
次に、特に目立つ因子として、Category_Kの視聴割合の分布を見ていきましょう。
今回は、離脱と継続それぞれで、その視聴割合の統計的な分布を箱ひげ図とヴァイオリンプロット(*1) で表現しました。
ここから読み取れるのは、継続した会員の半分についてCategory_Kが視聴割合の2割を占める一方で、離脱した会員の半分は一度もCategory_Kを視聴していないということです。
今回のデータセットで月の映画視聴本数の中央値(会員の半分にあてはまる)は5本なので、具体的には少なくとも1本は、Category_Kの作品を見ているということになります。
つまり、Category_Kの映画を少なくとも1本見ていれば、継続確率が高くなるわけです。
もちろん、最新作や人気の1作品に引っ張られている可能性もあるでしょう。
今回の分析結果を手掛かりに、さらに深堀することで別の仮説を得ることにつなるがるかもしれません。
(例えば、最新作の視聴本数や、人気映画の傾向を分析して、コンテンツ拡充の判断材料とする次の分析アクションが期待できそうです。)
*1 箱ひげ図は統計値が読み取れる形ですが、そこからデータのボリュームを把握するにはかなり統計値に慣れ親しんでいると人じゃないと困難です。ヴァイオリンプロットは密度を表現していてデータのボリューム的な分布を直感的にわかりやすくしてくれるグラフです。
まとめ
ロジスティック回帰分析のビジネスでの使い方について紹介しました。
今回の例にあげたように、大事なのは、「ビジネスでどう使うか」を中心に考えることです。
回帰分析の結果から、ビジネスアクションを考えることで、「継続率をあげる」という目的が達成できます。
また、「分析の実施」によって思うような結果が得られなかったとしても、次につながる新たな仮説の発見が期待できます。
統計的な手法を使う事で、より成果に貢献するアクションが何なのかを示してくれるロジスティック回帰分析。いかがだったでしょうか。
かっこでは、ビジネスに、ロジスティック回帰分析を活用していくお手伝いはもちろん、1億レコードまでのデータであれば、お手軽にデータ分析をはじめられる「さきがけKPI」というサービスも提供しています。
ぜひ、お気軽に、お問い合わせください。