「コロナのせいで外出できないし、家で出来ることないかな」
おうち時間が増えた今、こんなことを考えている人も多いのではないでしょうか。
かっこのデータサイエンス部で、インターンをしている私は「こんなときこそ家で映画を観るチャンスであり、なるべく多くの人と共通の話題となる映画作品を観ておこう!」と思いました。
しかし、普段映画を観ないので、何を見たら良いのか分かりません。
そこで、
多くの人が観ており、かつ満足できる作品を選ぶための手順をデータ解析から明らかにしたい
と考えました。
また、その過程で、視聴者数が10万人を超える条件や、お薦めのジャンル、いま、おさえておくべき監督も、明らかになったので説明したいと思います。
最初に、この記事における
「コスパの良い作品」とは、評価と視聴者数がともに高い作品であると、定義しておきます。
また、作品はアメリカ映画に絞って考えてみました。
目次
使用するデータについて
使用する作品データは、Filmarksという国内最大級の映画・ドラマ・アニメのレビューサイトからスクレイピングして抽出しました。(2020/4/1時点)
取得したデータはアメリカ映画 31,580件です。
このうち、「評価がない作品」と「動画配信サービスに対応していない作品」を除いた8,799件を分析データとして使用しました。
取得したデータの例
・作品名 :コンテイジョン
・上映日 :Nan
・上映時間 :106 (分)
・評価 :3.3 (5点満点)
・観た人数 :14147
・観る予定の人数 :5221
・視聴者数(総数) :19368
・ジャンル : パニック, スリラー
・監督 :スティーブン・ソダーバーグ
・脚本家 :スコット・Z・バーンズ
・主演 :マリオン・コティヤール
・動画配信サービス : 対応
視聴者数が10万人を超える3つの条件
上映時間、評価、上映日と視聴者数の関係を図にしてみたところ、視聴者数が10万人を超える3つの条件が見つかりました。
・上映時間 : 80~200分
・評価 : 3.3以上4.5以下
・上映日 : 1985年以降
Filmarksが2012年にサービスを開始していることから、最近の作品の方が10年以上前の作品よりも視聴者数が多い傾向があります。
音楽・ミュージカル映画はコスパが高め、ホラーのコスパは低い
ジャンル別に評価平均と視聴者数平均を求め、散布図を作成しました。
30個あるジャンルから右上に位置する11個のジャンルは、コスパの良い作品の割合が大きいジャンルだと考えられます。
特に、音楽・ミュージカル映画は視聴者数と評価がともに高い傾向にあり、ロマンスやファンタジーにも同様の傾向が見られることから、明るくワクワクする作品は万人受けしやすいと想像できます。
逆に、ホラー映画は視聴者数も評価も低めなようです。
ジャンル別に作品数の割合を示す円グラフはこのようになりました。
また、ジャンルごとに箱ひげ図を作成してみました。
箱ひげ図の下から出ているオレンジ色の棒グラフはそれぞれのジャンルの作品数を表しています。
右にいくにつれて作品数の多いジャンルになっています。
箱ひげ図で注目したいのは、赤で囲まれた箱ひげです。これらは図の上側に位置しており、作品数もそれほど多くないことから、上質な作品に出会いやすいジャンルであることがわかります。
ちなみに、ホラー映画は円グラフで全体の7%を占めているものの、箱ひげ図で見ると右から4番目なのに図の下側に位置しており、作品数が多い割には相対的に視聴者の評価が低く、見ている人が少ない作品が、量産されているジャンルと言えそうです。
迷ったら、クリストファー・ノーラン監督を選ぶべし
監督別、脚本家別、主演別に作品の評価平均、視聴者数平均の関係をみてみます。
この分布はコスパの良い作品に多く関わっている人物のみに絞って作表しました。
この中で私が注目するのはクリストファー・ノーラン監督です。
彼は、バットマン3部作のダークナイトシリーズやインセプション、インターステラー、TENETなどSFアクション映画で数多くのヒット作を生み出しています。
クリストファー・ノーラン監督の作品数は、今回の分析対象の中では13個と圧倒的に多く、しかも安定してヒット作を作り続けている数少ない人物の1人です。
データの絞り込み
以上の分析から、「評価と視聴者数がともに高い作品」=「コスパの良い作品」を絞り込むための条件を定めました。
この条件で絞り込まれる作品は以下のとおりです。
さらに、評価が3.8以上かつ視聴者数が10万人以上の作品だけが残るように不要な項目を削除します。
この条件を元にコスパの良い作品選びに手順を提案します。
私が提案するコスパの良い作品選びの手順
1.ダントツで視聴者数が多く、高評価のラ・ラ・ランドを観る
2.グレイテスト・ショーマンを観る
3.ボヘミアン・ラプソディを観る
4.アバウト・タイムを観る
5.ここまで観れば十分だと思うのでここからはランダムでコスパの高い作品を観ることにする
1)図の監督 or 脚本家 or 主演から1人選ぶ
2)図に記載の上映時間、上映日、ジャンルに該当する作品を選ぶ
5を繰り返す
このように、データ分析は、客観的材料から、とるべきアクションの優先度を明らかにしてくれます。
事業で生み出される、おびただしいデータと選択肢の中で、判断に迷ったら、ぜひ、ご相談ください。
