topics

湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた

近頃データサイエンスというワードを耳にすることも増えてきたと思いますが、データサイエンスの有用性に半信半疑な方も多いのでは無いでしょうか。

今回は、私がインターンの課題として取り組んだ、湘南鎌倉エリアでの物件探しを通じて、データサイエンスの重要性を感じてもらえればと思います。

課題内容

私が取り組んだ課題は、湘南鎌倉エリアに移住を考えている女性の部屋探しをデータサイエンスで手伝う、と言うものでした。

そこで、移住を考えている女性の中でも特にいそうな4つのモデルケースを設定し、各々に最適な条件設定を導くことにしました。

今回設定したモデルケースは以下の通りです。

  • 防犯面を気にする女性
  • 手ごろな値段で、津波の心配がない家を探す女性
  • 子育て中の若い女性
  • セカンドライフを楽しみたい女性

結論

データサイエンスにより得られた条件での家探しは、友人たちの直感的な条件で探すよりも、103%~236%も多くの候補物件をヒットさせることが出来ました。

直感だけでは、候補に入らなかった潜在的な選択肢が、明らかになったのです。

どのモデルに関しても条件にあてはまる物件が増えており、かつ、安全な物件という条件を大きく損なっていないにもかかわらず家賃のハードルが低くなっていることがわかります。

これより実際にデータをみて判断することの有効性がわかりますよね。

わたしの友人たちが、各モデルに最適そうな家探しの条件を直感であげると、次のようなものになりました。

  • 防犯面を気にする女性
    → 駅近で築年数の浅いマンション
    =徒歩5分未満・築15年未満・マンション
  • 手ごろな値段で、津波の心配がない家を探す女性
    →駅から近くて狭いアパート
    =徒歩10-30分・専有面積20m²未満・アパート
  • 子育て中の若い女性
    →少し古くて広めの駅近マンション
    =徒歩5分未満・築15-33年・45m²以上・マンション
  • セカンドライフを楽しみたい女性
    →駅から遠くて新しく、広めのマンション
    =徒歩10-30分・築15年未満・27-45m²・マンション

一方、データサイエンスを用いて得た条件は以下の通りです。

  • 防犯面を気にする女性

築15年未満・専有面積20−27m²・徒歩5−10分

  • 手頃な値段で、津波の心配がない家を探す女性

築15−33年・20m²未満・徒歩5−10分

  • 子育て中の女性

築15−33年・45m²以上・徒歩5分未満

  • セカンドライフを楽しみたい女性

築15年未満・専有面積27-45m²・徒歩10-30分

では、上記の条件は一体どのようにして得られたのでしょうか。

この条件にたどり着くまでの過程を、順を追って説明していきたいと思います。

使用したデータ

分析に使用したデータについてです。

SUUMO関東版から物件に関するデータを取得しました。情報は2021年4月28日時点のものとなっています。

湘南・鎌倉エリアでの部屋探しを想定しているため、江ノ島電鉄線沿線の物件を対象とし上記のサイトから取得した一部の情報が下記の通りです:

・最寄り駅
・最寄りまでの徒歩時間
・築年数
・建物種別
・専有面積
・間取り
・向き
・家賃

また上記の情報の他に、

オートロック設置、管理人在中、TVモニタ付きインターホン設置、防犯カメラ設置、セキュリティ会社加入、女性限定、宅配ボックス設置、ディンプルキー搭載、ダブルロックキー搭載、二階以上

のような防犯に関係する条件を収集し、物件ごとに、上の防犯条件が何個当てはまるのかを記録し、当て嵌まった個数を防犯レベルと定義しました。

防犯レベルは、各物件に設置されているオートロックや防犯カメラなどの防犯設備の種類数を表しているため、各物件のセキュリティの高さを示す指標といえます。

分析を始めるにあたり6SLDKや8LDKの物件など、 絶対借りなそうな物件を外しました。さらに家賃分布を見ると家賃20万円以上の物件が非常に少ないため、それらも除外しました。

防犯レベルと関係の深い要素

まず、防犯レベルと関係の深い要素を探索していきます。

建物種別 ~ マンションに高セキュリティー物件が多い

始めに建物種別と防犯レベルの関係を見ていきます。

下の箱ひげ図から、マンションに高セキュリティー物件が多くあることがわかります。

最寄駅 ~ 駅はどこでも選べる

次に最寄駅と防犯レベルの箱ひげ図をみてみると、藤沢駅に防犯レベル4以上の物件が偏っていることがわかります。


ここで、防犯レベル4以上にこだわる必要があるのかを考えていきます。

下図を見ると、レベル3からレベル4に上がることによって、青とオレンジが表すディンプルキーとダブルロックキーの割合が、増えていることがわかります。

ここから、レベル4にあってレベル3にないものがディンプルキーとダブルロックキーであることがわかりますが、どちらとも入居後に3万円程度で鍵を付け替えれば良いため、防犯レベル4以上の物件に拘らなくとも十分に安全な生活が送れると言えます。

この結果を見るに、特に駅は絞り込まなくても、自由に選べそうです。

防犯レベルに最も影響するのは築年数

残りの徒歩時間・築年数・専有面積・家賃・管理費と、防犯レベルの関係をまとめて見ていきます。

ここから特に関係がありそうな徒歩時間・築年数・専有面に目星をつけ、関係の深さの具合を示す相関係数で比較すると、築年数>>専有面積>徒歩時間の順で防犯レベルと関係が深いことがわかりました。

家賃と防犯レベルに相関が見られないのは意外でした

ここまでで

  • 建物種別
  • 築年数
  • 専有面積
  • 徒歩時間

の4つの要素が防犯レベルに関連するとわかりました。

最適条件の決定

次に、モデルケース別の最適条件を割り出していきます。

築年数

下の図を参考に防犯レベルが大きく変わっている15年と33年で区切ると、築年数別で平均防犯レベルの他に平均家賃に大きな差が見られました。

以下が築年数別の物件数・平均家賃・平均防犯レベルです。

築15年未満:

 3639件, 平均家賃8.1万円, 平均防犯レベル2.56

築15-33年:

 3979件, 平均家賃7.5万円, 平均防犯レベル1.40

築33年以上:

 1872件, 平均家賃6.1万円, 平均防犯レベル1.06

これらから、各モデルケースに最適な築年数は以下の通りになります。

  • 防犯面を気にする女性

 防犯面が第一 → 築15年未満

  • 手ごろな値段で、津波の心配がない家を探す女性

 コストはかけられない → 築15-33年

  • 子育て中の若い女性

 築年数にこだわりはない・なるべく家賃は抑えたい → 築15-33年 

  • セカンドライフを楽しみたい女性

 新しい家がいい・安心安全な物件がいい → 築15年未満

専有面積

下の専有面積の分布を参考に、分布の山ごとに20m², 27m² ,45m²で区切ると、面積別で平均防犯レベルの他に、防犯カメラ数・南向き物件数に大きな差が見られました。

以下が専有面積別の物件数・防犯カメラ数・南向き物件数・平均防犯レベルです。

専有面積20m²未満:

 1875件, 防犯カメラ453件, 南向き241件, 防犯レベル1.42

専有面積20-27m²:

 2722件, 防犯カメラ144件, 南向き532件, 防犯レベル2.24

専有面積27-45m²:

 2548件, 防犯カメラ437件, 南向き699件, 防犯レベル1.86

専有面積45m²以上:

 3028件, 防犯カメラ296件, 南向き1097件, 防犯レベル1.45

これらから、各モデルケースに最適な専有面積は以下の通りになります。

  • 防犯面を気にする女性

 防犯面が第一 → 20-27m²

  • 手ごろな値段で、津波の心配がない家を探す女性

 コストを抑えたい → 20m²未満

  • 子育て中の若い女性

 広い方がいい・日当たりが良い方がいい → 45m²以上

  • セカンドライフを楽しみたい女性

 狭すぎず広すぎない部屋がいい → 27-45m²

徒歩時間

先程と同様に、徒歩時間についても分布の山ごとに5分,10分,30分で区切りました。

以下が徒歩時間別の物件数・平均防犯レベルです。

最寄りの公共交通機関から徒歩5分以内:

 2865件, 防犯レベル1.68

徒歩5-10分:

 3176件, 防犯レベル2.07

徒歩10-30分:

  2720件, 防犯レベル1.51

徒歩30分以上:

 1412件, 防犯レベル1.33

ここで考えたいのが、徒歩30分以上の物件についてです。

上図の薄いグレーの部分が徒歩30以内の物件区域なのですが、この区域で最も海から離れている地点から海までが、大体自転車で20分程度の距離でした。

今回の発表の対象者は、移住によって「海と山を感じられる生活」を期待していると言えるので、海から離れすぎている「徒歩時間30分以上」の条件は除くことにしました。


また、上の地図のように想定津波到達区域を重ね合わせると、徒歩時間10分以内を示す濃いグレーの区域に対し、薄いグレーの区域の方が津波が到達していないことがわかります。

ここから、津波のリスクをできる限り下げたい人には、徒歩時間10分以上の物件が適していることがわかります。

以上より、各モデルケースの最適な徒歩時間は以下のようになります。

  • 防犯面を気にする女性

 防犯面が第一 → 徒歩5-10分

  • 手ごろな値段で、津波の心配がない家を探す女性

 津波が怖い → 徒歩10-30分

  • 子育て中の若い女性

 電車をよく使う → 徒歩5分未満 

  • セカンドライフを楽しみたい女性

 利便性はあまり重視しない → 徒歩10-30分

まとめ

以上の条件をまとめると、冒頭で紹介したモデルケース別最適条件を得ることができました。

  • 防犯面を気にする女性

 → 築15年未満・20-27m²・徒歩5-10分

  • 手ごろな値段で、津波の心配がない家を探す女性

 → 築15-33年・20m²未満・徒歩10-30分

  • 子育て中の若い女性

 → 築15-33年・45m²以上・徒歩5分未満 

  • セカンドライフを楽しみたい女性

 → 築15年未満・専有面積27-45m²  ・徒歩10-30分

以上より、統計的に条件を導いていくことで、より選択肢の幅の広い条件が得られることを実感していただけたと思います。

そしてこれは様々な場面で共通して言えることでもあります。

どんなに些細なことでも、直感で選んだことが将来の大きな可能性を潰してしまうことは少なくありません。

かっこのデータサイエンスで、データに裏打ちされた意思決定を始めてみませんか。

ピックアップ記事

  1. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  2. 学生をデータサイエンティストに育てる4つのポイント
  3. 知っておきたいAIの理想と現実
  4. 優良顧客を見つける「RFM分析」の考え方と使い方
  5. こんなときには異常検知

関連記事

  1. topics

    大学時代の成績からNFLのドラフト順位を予測してみた

    かっこ株式会社のデータサイエンス事業部でインターンをしながら、アメリカ…

  2. topics

    データ分析を使って、東急東横線沿線で楽器弾きのための家探しをしてみた

     楽器演奏を趣味とする人にとって物件探しは骨の折れ…

  3. topics

    多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

    「コロナのせいで外出できないし、家で出来ることないかな」おうち時間…

  4. topics

    大阪のホテル相場は1泊4500円。条件の違いで相場がどれだけ変わるのか見える化してみた

    旅行の計画を立てるとき、ホテルのプラン選びで悩む人は多いのではないでし…

  5. topics

    データで判断! エンジニアの沖縄移住、おすすめエリア

    かっこ株式会社のデータサイエンス事業部でインターンをしている長峯です。…

カテゴリー

おすすめ記事

  1. 確率を予測する「ロジスティック回帰」とは
  2. データサイエンスを現場の敵にしないために
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. 箱ひげ図 について超カンタンに解説してみた
  5. 知っておきたいAIの理想と現実
  1. 機械学習

    決定木でデータドリブンに、ビジネスを成功させる判断基準を作ろう
  2. 統計

    優良顧客を見つける「RFM分析」の考え方と使い方
  3. topics

    大学時代の成績からNFLのドラフト順位を予測してみた
  4. internship

    人生を変えた2年間のかっこ生活
  5. 統計

    こんなにも使える、単純集計とクロス集計の活用法
PAGE TOP