インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

データ分析例

データ分析でわかる!? ハワイ・ホノルルエリアのおすすめ宿泊施設

データ分析でわかる!? ハワイ・ホノルルエリアのおすすめ宿泊施設のアイキャッチ画像

行ってみたい場所ランキング上位に度々上がるハワイ。

ハワイ旅行と聞くと何か特別感がありますが、大変なのは宿泊施設選びです。

初めて訪れる人にとって、価格、宿泊施設のタイプ、場所など様々な選ぶ要素があり、選ぶのは難しいでしょう。

そこで、今回はデータサイエンスを使って、お得かつ満足度の高い宿泊施設を導き出していきます。

今回の条件は、​​​​

休暇が取りやすいお盆休みにファミリー(大人2人、子ども2人)で宿泊する

という想定で分析を行います。

4泊6日がスタンダードされているため、4泊で宿泊できる施設を調べます。

結論

結論のアイキャッチ画像

データ分析から得られた結果は以下のようになりました。

  • 宿泊施設の相場は一泊あたり3万円である
  • 場所は価格に影響しにくい
  • 星の数×評価・星の数・評価の順で価格に影響を与えやすい
  • 星の数と評価の相関関係が高い

結果から、場所は価格に影響しにくいため、行ってみたいビーチや観光スポットの近くの宿泊施設で星の数や評価で宿泊施設を探すべきだと分かりました。

また、評価がわからない場合でも星の数が多い場所を選ぶと比較的満足度の高い宿泊施設を選べます。

しかし、今回の予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探せる可能性はあります。

引用したサイト

引用したサイトのアイキャッチ画像

今回、分析の際に利用した情報は、Booking.comから取得したものです。(2022/01/08 時点)

取得した情報は以下の6項目です。

  • 宿泊施設名
  • 価格 (4泊あたり(価格))
  • 星の数 (5段階評価のランク)
  • 顧客の評価 (10点中)
  • ビーチへの距離 (km)
  • 中心部からの距離 (km)

※中心部はダウンタウンを指す

以下で、分析の概要について解説していきます。

分析の概要

分析概要のアイキャッチ画像

適切な宿泊施設を探すために、以下の3つについて調べました。

  • 宿泊施設の相場
  • 条件項目同士の相関関係
  • 価格に影響する条件

それぞれの分析結果とおすすめの検索方法、実際に導き出された『おすすめ宿泊施設ベスト3を紹介します。

①宿泊施設の価格相場を調べる

適切な宿泊施設を探すためには、価格の相場からどれくらいの価格が普通なのかを調べる必要があります。

そのため、ヒストグラムを用いて宿泊施設の価格の分布を可視化することで相場を把握していきます。

「ヒストグラムってなんだっけ?」と気になる方は、『ヒストグラムとは?見方やエクセルでの作り方・経営分析の例を解説』の記事をご参照ください。

下図が、宿泊施設の4泊あたりの価格のヒストグラムです。

※分布が見やすいように、1泊60万円以上のものは除く

4泊あたりの平均値は20万4780円、中央値は11万8246円となり、1泊あたりに直すと平均値が5万1198円、中央値が2万9562円となりました。

平均値は極端な値に影響を受けやすく、ホテルの価格は極端なものもあるため、今回は中央値である3万円を相場と決定します。

「平均値と中央値っていまいちどう使い分けるか分からない…」とお悩みの方は、『なんでも平均でいいの?中央値と平均値をどう使い分けるか』の記事をご参照ください。

宿泊施設の相場を明らかにできたところで、以下ではそれぞれのデータ項目の相関関係を調べていきます。

②条件項目同士の相関関係を調べる

条件項目同士の相関関係を調べることで、適切な宿泊施設を選ぶために本当に重要な条件項目を見つけられます。

なぜなら、条件項目同士の相関係数が強ければ、どちらか一方の条件を設定するだけでもう片方の条件も設定できるためです。

条件項目同士の相関関係を調べたデータは以下の5つです。

  • 価格
  • 星の数
  • 評価
  • ビーチへの距離
  • 中心部からの距離

相関関係についておさらいしておきたい方は、『2種のデータの関係性を明らかにする「相関」のおはなし』の記事をご参照ください。

以下で、実際に相関を調べた結果を解説します。

相関分析の結果を解釈する

条件同士の相関関係の結果を表したグラフが下図です。

青い矢印が価格と星の数、黄色い矢印が価格と評価、灰色の矢印が星の数と評価の相関関係を表しています。

それぞれの散布図が2つの条件項目の関係性を示しており、一気に相関関係を掴めます。

散布図について詳しく知りたい方は、『データの関係性がパッと見でわかる「散布図」』の記事をご参照ください。

それぞれの散布図から相関係数を計算した表が以下になります。

黄色にマークしている数値が、正の相関がある程度認められるものです。

以上の相関係数の表から、以下のような仮説を立てられます。

  • 中心部への距離が近いとビーチへの距離も近い宿泊施設を選べる
  • ビーチや中心部への距離は価格に影響しにくい
  • 星の数が増えると、評価も高くなる傾向にある
  • 星の数か評価が高いものほど比較的価格も高くなる傾向にある

このように、それぞれの条件項目間の相関関係を調べることで、何が適切な宿泊施設を選ぶために重要かを見つけ出せるのです。

以下では、価格に影響を与える要素の組み合わせについて解説していきます。

③価格に影響を与える要素の組み合わせ

価格に影響を与えている要素の組み合わせは、重回帰分析を使用して求めていきます。

回帰分析とはある結果に対してどのような要素が影響を与えているのかを把握できる手法で、今回のように結果への影響を調べるにはもってこいです。

回帰分析について詳しく知りたい方は、『実は簡単! 10分あれば回帰分析ができます』の記事をご参照ください。

それでは、価格に影響を与えている要素の組み合わせの求め方を解説していきます。

重回帰分析を行う

今回は、2つ以上の要因(説明変数)が、ある結果(目的変数)に与える影響度合いを分析する重回帰分析を用いて、分析を進めます。

星の数、評価、ビーチへの距離、中心部とそれらの交互作用が価格に与える影響の大きさを調べました。

交互作用とは2つの条件項目を組み合わせた条件のことです。例えば、「星の数」と「評価」の交互作用は「星の数が多くかつ評価が高い状態」のように2つの組み合わせであると考えましょう。
実際に重回帰分析を行った結果が下図です。

「星の数:評価」となっている箇所が交互作用であり、回帰分析の精度は自由度調整済み決定係数で判断しています。

回帰分析の結果から、以下のことが分かります。

  • 星の数と評価のそれぞれの価格の相関が強いとは言えない
  • 星の数と評価の両方が高くなると宿泊施設の価格が高くなる
  • モデルの精度は0.2441で価格を説明しきれていない可能性がある

星の数と評価のそれぞれの価格の相関が強いとは言えませんが、星の数と評価の両方が高くなると宿泊施設の価格が高くなる傾向にあります。

しかし、回帰分析の精度が高くないことから、そもそも4つの変数だけだと価格との関係性を表しきれていない可能性が高いです。

また、星の数と評価が両方とも高いものでも、価格の安い宿泊施設を探せる可能性があることに注意してください。

星の数と評価の関係を調べる

適切な宿泊施設を選ぶため、最も価格との相関関係が強い星の数と評価の関係を調べてみます。

散布図に可視化したのが、下図です。

​​

上図の分布から、星の数が4以上のものであれば、評価が7.5以上の場所を選べると分かります。

このように、重回帰分析を用いて価格に対して影響を与える変数を見つけ出し、個別に関係性を調べることで、適切な宿泊施設を選ぶ条件を見つけ出せるのです。

分析の結果をまとめると以下の通りです。

  • 宿泊施設の相場は一泊あたり3万円である
  • 場所は価格に影響しにくい
  • 星の数×評価・星の数(ホテルのランク)・評価の順で価格に影響を与えやすい
  • 星の数と評価の相関関係が高い

とはいえ、予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探せる可能性があります。

以下では実際に適切な宿泊施設をどう調べるのか、結果も含めてご紹介します。

おすすめの宿泊施設の検索方法

お得かつ満足度が高い宿泊施設の検索するには以下の点を意識するとよいでしょう。

  • 星の数と評価の相関が最も強いことから、星の数が高くなれば評価も高くなる
  • 星の数が4以上の施設を選ぶと評価7.5以上の宿泊施設を選べる

上記の方法で調べたところ、価格が安い順に宿泊施設を調べたところ、以下がベスト3になりました。

順位 宿泊施設名 価格 星の数 評価
1 ヒルトン ガーデン イン ワイキキ ビーチ
(ホテルタイプ)
約23,900円 4 8.3
2 ワイキキ リゾート ホテル
(ホテルタイプ)
約23,950円 4 8.1
3 Executive Hotel Suite Downtown
(アパートメントホテルタイプ)
約24,250円 4 9.0

※​​2022/01/08 時点

以上の表のように、分析結果を利用した検索方法により、相場の3万円よりも大きく下回る価格の宿泊施設を探せました。

また意外にもランク以上で価格が最も安いのは、アパートメントタイプではなくホテルタイプの宿泊施設だということも特定できます。

まとめ

今回は、データサイエンスを用いて「ハワイ・ホノルルエリアのおすすめ宿泊施設」を探す方法について解説しました。

結果として、2022年1月時点では、以下の3つのホテルがベスト3であると導けました。

順位 宿泊施設名 価格 星の数 評価
1 ヒルトン ガーデン イン ワイキキ ビーチ
(ホテルタイプ)
約23,900円 4 8.3
2 ワイキキ リゾート ホテル
(ホテルタイプ)
約23,950円 4 8.1
3 Executive Hotel Suite Downtown
(アパートメントホテルタイプ)
約24,250円 4 9.0

今回は、ハワイ・ホノルルエリアの宿泊施設の分析を行いましたが、他の地域の宿泊施設の分析も今回の方法で行えます。

もし、旅行でおすすめの宿泊施設を探したい場合は、この記事を参考に宿泊施設の分析をしてみてください。

ピックアップ記事

  1. こんなときには異常検知
  2. 知っておきたいAIの理想と現実
  3. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  4. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. 湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみたのアイキャッチ画像

    データ分析例

    湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた

    家探しの条件ってどうやって決める? 女性の家探しでどこを…

  2. 左から福山、おおたけ、安中

    データ分析例

    日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知」活用事例

    かっこでは、AI、統計学、数理最適化などのデータサイエンス技術を用いて…

  3. バレーボール データ分析のアイキャッチ画像

    データ分析例

    データサイエンスでバレーボールチームの戦術を考えてみた

    近年、ビジネス課題を解決するために、データを用いたアプローチがなされる…

  4. 映画鑑賞初心者の私がデータ分析で映画を選んでみたのアイキャッチ画像

    データ分析例

    映画鑑賞初心者の私がデータ分析で映画を選んでみた

    最近コロナ禍で在宅時間が増え、在宅でできる新しい趣味を始めたい方が多い…

  5. NFL ドラフト アイキャッチ画像

    データ分析例

    大学時代の戦績からNFLのドラフト順位を予測してみた

    大学時代の戦績からドラフト順位って予測できる? ドラフト…

  6. データ分析で防音物件探し

    データ分析例

    データ分析を使って、東急東横線沿線で楽器弾きのための家探しをしてみた

    「楽器の練習をしたいけど、音を出せる場所がない」「楽器演奏ができる…


おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. 分析

    マーケティングから不正検知まで、データの理解と意思決定を助けてくれる「クラスタリ…
  2. バレーボール データ分析のアイキャッチ画像

    データ分析例

    データサイエンスでバレーボールチームの戦術を考えてみた
  3. インターン体験記

    就活で話すことには困らないかっこのインターンシップ経験!
  4. 統計

    データの関係性がパッと見でわかる「散布図」
  5. 映画鑑賞初心者の私がデータ分析で映画を選んでみたのアイキャッチ画像

    データ分析例

    映画鑑賞初心者の私がデータ分析で映画を選んでみた
PAGE TOP