インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

データ分析例

データ分析でわかる!? ハワイ・ホノルルエリアのおすすめ宿泊施設

行ってみたい場所ランキング上位に度々上がるハワイ。

ハワイ旅行と聞くと何か特別感がありますよね?

ただ、そこで大変なのは宿泊施設選びです。

初めて訪れる人にとって、価格、宿泊施設のタイプ、場所など様々な選ぶ要素があり、選ぶのは難しいと思います。

そこで、統計学とデータ分析の力を使って、お得かつ満足度の高い宿泊施設を導き出していきます。

 

今回の条件は、

​​​​例年、日本の観光客が一番多い月は8月ですので、休暇が取りやすいお盆休みにファミリー(大人2人、子ども2人)で宿泊する想定で分析を行います。 

4泊6日がスタンダードされているため、4泊で宿泊できる施設を調べます。

結論

データ分析から得られた結果は以下のようになりました。

  • 宿泊施設の相場は一泊あたり3万円である
  • 場所は価格に影響しにくいため、行ってみたいビーチや観光スポットの近くを選ぶべきである
  • 価格に影響しやすいのは、星の数(ホテルのランク)と評価、次に星の数、評価の順である
  • 星の数と評価の相関関係が高いことから、評価がわからない場合でも星の数が多い場所を選ぶと比較的満足度の高い宿泊施設を選ぶことができる
  • ただし、今回の予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探すことができる可能性が大いにある

ここから分析の内容を深掘りしていこうと思います。

引用したサイト

今回、分析の際に利用した情報は、Booking.comから取得したものです。(2022/01/08 時点)

取得した情報は以下の6項目です。

  • 宿泊施設名
  • 価格 (4泊あたり(価格))
  • 星の数 (5段階評価のランク)
  • 顧客の評価 (10点中)
  • ビーチへの距離 (km)
  • 中心部からの距離 (km)

(中心部はダウンタウンを指す)

分析概要

今回は以下の3つについて調べました。

  • 宿泊施設の相場
  • 条件同士の相関関係
  • 価格に影響する条件

最後におすすめの検索方法と、そこから導き出された『おすすめ宿泊施設ベスト3』をご紹介いたします。

宿泊施設の価格相場

こちらは、4泊あたりの価格のヒストグラムです。

(分布が見やすいように、1泊60万円以上のものは除いたもの)

​​4泊あたりの平均値は20万4780円、中央値は11万8246円となりました。

1泊あたりの平均値が5万1198円、中央値が2万9562円となりました。

平均値は極端な値に影響を受けやすいことから、中央値と差が開いてしまいます。

上記の理由から、今回は中央値である3万円を相場と致します。

条件同士の相関関係

使用したデータは価格、星の数、評価、ビーチへの距離、中心部からの距離の5つです。

相関分析の結果

条件同士の相関関係を表したグラフです。

青い矢印が価格と星の数、黄色い矢印が価格と評価、灰色の矢印が星の数と評価の相関関係を表しています。

  • 中心部への距離が近い宿泊施設を選ぶことで、自ずとビーチへの距離も近い宿泊施設を選ぶことができる、またその逆である可能性が高い
  • ビーチや中心部への距離は価格に影響しにくい
  • 星の数が増えると、評価も高くなる傾向にある
  • 星の数、あるいは評価が高いものほど比較的価格も高くなる傾向になる
  • 星の数、評価がそれぞれ価格との相関がとても強いとは言えないものの、星の数も評価も高い宿泊施設はほとんどの確率で値段が上がる

価格に影響を与える要素の組み合わせ

重回帰分析を使用して、価格に影響を与える要素について見ていきます。

重回帰分析

重回帰分析は、2つ以上の要因(説明変数)が、ある結果(目的変数)に与える影響度合いを分析する方法です。詳しくは、​​今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話しをご覧ください。

今回は、星の数、評価、ビーチへの距離、中心部とそれらの交互作用が価格に与える影響の大きさを調べます。

重回帰分析の結果

  • 星の数、評価がそれぞれ価格の相関が強いとは言えないものの、星の数と評価の両方が高くなるにつれて、宿泊施設の価格が高くなる
  • モデルの精度は0.2441で、これら4つの変数だけでは価格を説明しきれないと言える
  • 星の数と評価の交互作用が価格に大きく影響を与えるものの、星の数と評価が高いものでも価格の安い宿泊施設を探すことができる可能性がある

星の数と評価の分布

最も価格との相関関係が強い星の数と評価の分布に着目します。

​​

星の数が4以上のものであれば、評価が7.5以上の場所を選ぶことができるという結果になりました

まとめ

  • 宿泊施設の相場は一泊あたり3万円である
  • 距離は価格に影響しにくいため、行ってみたいビーチや観光スポットの近くを選ぶべきである
  • 価格に影響しやすいのは、星の数と評価、次に星の数、評価の順である
  • 星の数と評価の相関関係が高いことから、評価がわからない場合でも星の数が多い場所を選ぶと比較的満足度の高い宿泊施設を選ぶことができる
  • ただし、予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探すことができる可能性が大いにある

以上が分析結果から得られました。

補足

おすすめの宿泊施設の検索方法

今までの分析結果を踏まえた上で、お得かつ、満足度が高い宿泊施設の検索方法についてご紹介いたします。

  1. 星の数と評価の相関が最も強いことから、星の数が高くなれば評価も高くなる想定で調べる
  2. 今回扱ったデータの星の数の分布より、星の数が4か5の施設を選ぶと評価7.5以上の宿泊施設を選ぶことができることから、星の数を4以上に定める
  3. 上記の条件を踏まえた上で、価格の低い順に並べて宿泊施設調べる

おすすめのホノルルエリアの宿泊施設ベスト3

上記の方法で調べたところ、価格が安い順に

  1. ヒルトン ガーデン イン ワイキキ ビーチ (ホテルタイプ)

価格:約23900円、星の数:4、評価:8.3

2. ワイキキ リゾート ホテル (ホテルタイプ)

価格:約23950円、星の数:4、評価:8.1

3. Executive Hotel Suite Downtown (アパートメントホテルタイプ)

価格:約24250円、星の数:4、評価:9.0

※​​2022/01/08 時点

 

という結果になりました。

分析結果を利用した検索方法により、相場の3万円よりも大きく下回る価格の宿泊施設を探すことができました。

また意外にもランク以上で価格が最も安いのは、アパートメントタイプではなくホテルタイプの宿泊施設だということがわかりました。

 

今回は、インターンシップの試用期間で取り組んだ課題である、データ分析による「ハワイ・ホノルルエリアのおすすめ宿泊施設」についてご紹介しました。

 

私たちの日々の生活の中には、たくさんのデータが溢れています。

データを有効活用することで、様々な意思決定に役立つイメージをしていただけたかと思います。

データを活用して解決したい課題がありましたら、​​ぜひかっこのデータサイエンスまでご相談ください。

 

ピックアップ記事

  1. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  2. 知っておきたいAIの理想と現実
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. こんなときには異常検知
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. データ分析例

    大学時代の成績からNFLのドラフト順位を予測してみた

    かっこ株式会社のデータサイエンス事業部でインターンをしながら、アメリカ…

  2. データ分析例

    データで判断! エンジニアの沖縄移住、おすすめエリア

    かっこ株式会社のデータサイエンス事業部でインターンをしている長峯です。…

  3. データ分析例

    データ分析による読み終わった漫画のメルカリ出品戦略

    フリマを利用したことはありますか?近年メルカリをはじめとした便利な…

  4. データ分析例

    多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

    「コロナのせいで外出できないし、家で出来ることないかな」おうち時間…

  5. データ分析例

    大阪のホテル相場は1泊4500円。条件の違いで相場がどれだけ変わるのか見える化してみた

    旅行の計画を立てるとき、ホテルのプラン選びで悩む人は多いのではないでし…

  6. データ分析例

    データサイエンスでバレーボールチームの戦術を考えてみた

    近年、ビジネス課題を解決するために、データを用いたアプローチがなされる…

カテゴリー

おすすめ記事

  1. 全力で食らいついたかっこでの1年間
  2. 確率を予測する「ロジスティック回帰」とは
  3. データサイエンスを現場の敵にしないために
  4. 優良顧客を見つける「RFM分析」の考え方と使い方
  5. 箱ひげ図 について超カンタンに解説してみた
  1. 分析

    サブスクリプションの利用継続KPIをロジステック回帰分析で明らかに!
  2. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!
  3. 統計

    成果をあげるためのアクションに、優先順位を与えてくれる「オッズ比」の使い方
  4. 分析

    それ分析じゃなく集計ですから
  5. 統計

    2種のデータの関係性を明らかにする「相関」のおはなし
PAGE TOP