行ってみたい場所ランキング上位に度々上がるハワイ。
ハワイ旅行と聞くと何か特別感がありますよね?
ただ、そこで大変なのは宿泊施設選びです。
初めて訪れる人にとって、価格、宿泊施設のタイプ、場所など様々な選ぶ要素があり、選ぶのは難しいと思います。
そこで、統計学とデータ分析の力を使って、お得かつ満足度の高い宿泊施設を導き出していきます。
今回の条件は、
例年、日本の観光客が一番多い月は8月ですので、休暇が取りやすいお盆休みにファミリー(大人2人、子ども2人)で宿泊する想定で分析を行います。
4泊6日がスタンダードされているため、4泊で宿泊できる施設を調べます。
目次
結論
データ分析から得られた結果は以下のようになりました。
- 宿泊施設の相場は一泊あたり3万円である
- 場所は価格に影響しにくいため、行ってみたいビーチや観光スポットの近くを選ぶべきである
- 価格に影響しやすいのは、星の数(ホテルのランク)と評価、次に星の数、評価の順である
- 星の数と評価の相関関係が高いことから、評価がわからない場合でも星の数が多い場所を選ぶと比較的満足度の高い宿泊施設を選ぶことができる
- ただし、今回の予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探すことができる可能性が大いにある
ここから分析の内容を深掘りしていこうと思います。
引用したサイト
今回、分析の際に利用した情報は、Booking.comから取得したものです。(2022/01/08 時点)
取得した情報は以下の6項目です。
- 宿泊施設名
- 価格 (4泊あたり(価格))
- 星の数 (5段階評価のランク)
- 顧客の評価 (10点中)
- ビーチへの距離 (km)
- 中心部からの距離 (km)
(中心部はダウンタウンを指す)
分析概要
今回は以下の3つについて調べました。
- 宿泊施設の相場
- 条件同士の相関関係
- 価格に影響する条件
最後におすすめの検索方法と、そこから導き出された『おすすめ宿泊施設ベスト3』をご紹介いたします。
宿泊施設の価格相場
こちらは、4泊あたりの価格のヒストグラムです。
(分布が見やすいように、1泊60万円以上のものは除いたもの)
4泊あたりの平均値は20万4780円、中央値は11万8246円となりました。
1泊あたりの平均値が5万1198円、中央値が2万9562円となりました。
平均値は極端な値に影響を受けやすいことから、中央値と差が開いてしまいます。
上記の理由から、今回は中央値である3万円を相場と致します。
条件同士の相関関係
使用したデータは価格、星の数、評価、ビーチへの距離、中心部からの距離の5つです。
相関分析の結果
条件同士の相関関係を表したグラフです。
青い矢印が価格と星の数、黄色い矢印が価格と評価、灰色の矢印が星の数と評価の相関関係を表しています。
- 中心部への距離が近い宿泊施設を選ぶことで、自ずとビーチへの距離も近い宿泊施設を選ぶことができる、またその逆である可能性が高い
- ビーチや中心部への距離は価格に影響しにくい
- 星の数が増えると、評価も高くなる傾向にある
- 星の数、あるいは評価が高いものほど比較的価格も高くなる傾向になる
- 星の数、評価がそれぞれ価格との相関がとても強いとは言えないものの、星の数も評価も高い宿泊施設はほとんどの確率で値段が上がる
価格に影響を与える要素の組み合わせ
重回帰分析を使用して、価格に影響を与える要素について見ていきます。
重回帰分析
重回帰分析は、2つ以上の要因(説明変数)が、ある結果(目的変数)に与える影響度合いを分析する方法です。詳しくは、今からとる行動が及ぼす影響の大きさを、数値で予測してくれる「回帰分析」のお話しをご覧ください。
今回は、星の数、評価、ビーチへの距離、中心部とそれらの交互作用が価格に与える影響の大きさを調べます。
重回帰分析の結果
- 星の数、評価がそれぞれ価格の相関が強いとは言えないものの、星の数と評価の両方が高くなるにつれて、宿泊施設の価格が高くなる
- モデルの精度は0.2441で、これら4つの変数だけでは価格を説明しきれないと言える
- 星の数と評価の交互作用が価格に大きく影響を与えるものの、星の数と評価が高いものでも価格の安い宿泊施設を探すことができる可能性がある
星の数と評価の分布
最も価格との相関関係が強い星の数と評価の分布に着目します。
星の数が4以上のものであれば、評価が7.5以上の場所を選ぶことができるという結果になりました。
まとめ
- 宿泊施設の相場は一泊あたり3万円である
- 距離は価格に影響しにくいため、行ってみたいビーチや観光スポットの近くを選ぶべきである
- 価格に影響しやすいのは、星の数と評価、次に星の数、評価の順である
- 星の数と評価の相関関係が高いことから、評価がわからない場合でも星の数が多い場所を選ぶと比較的満足度の高い宿泊施設を選ぶことができる
- ただし、予測モデルの精度は完全と言えないため、星の数や評価が高くても価格が安い宿泊施設を探すことができる可能性が大いにある
以上が分析結果から得られました。
補足
おすすめの宿泊施設の検索方法
今までの分析結果を踏まえた上で、お得かつ、満足度が高い宿泊施設の検索方法についてご紹介いたします。
- 星の数と評価の相関が最も強いことから、星の数が高くなれば評価も高くなる想定で調べる
- 今回扱ったデータの星の数の分布より、星の数が4か5の施設を選ぶと評価7.5以上の宿泊施設を選ぶことができることから、星の数を4以上に定める
- 上記の条件を踏まえた上で、価格の低い順に並べて宿泊施設調べる
おすすめのホノルルエリアの宿泊施設ベスト3
上記の方法で調べたところ、価格が安い順に
- ヒルトン ガーデン イン ワイキキ ビーチ (ホテルタイプ)
価格:約23900円、星の数:4、評価:8.3
2. ワイキキ リゾート ホテル (ホテルタイプ)
価格:約23950円、星の数:4、評価:8.1
3. Executive Hotel Suite Downtown (アパートメントホテルタイプ)
価格:約24250円、星の数:4、評価:9.0
※2022/01/08 時点
という結果になりました。
分析結果を利用した検索方法により、相場の3万円よりも大きく下回る価格の宿泊施設を探すことができました。
また意外にもランク以上で価格が最も安いのは、アパートメントタイプではなくホテルタイプの宿泊施設だということがわかりました。
今回は、インターンシップの試用期間で取り組んだ課題である、データ分析による「ハワイ・ホノルルエリアのおすすめ宿泊施設」についてご紹介しました。
私たちの日々の生活の中には、たくさんのデータが溢れています。
データを有効活用することで、様々な意思決定に役立つイメージをしていただけたかと思います。
データを活用して解決したい課題がありましたら、ぜひかっこのデータサイエンスまでご相談ください。