インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

データ分析例

湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた

湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみたのアイキャッチ画像
  • 家探しの条件ってどうやって決める?
  • 女性の家探しでどこを重視すればいいか分からない…
  • 求めてる家が見つからない…

とお悩みではありませんか。

家探しの時にどんな条件で探せばいいか悩みがちですが、データから分析することであなたが求める理想の条件を見つけられるのです。

今回は「湘南・鎌倉エリアでの家探し」に絞って、実際のデータから4つのモデルケースの人に合う最適な条件を分析によって導き出します。

データ分析の重要性も理解してもらえる記事となっていますので、ぜひ最後まで参考にしてください。

\経験豊富なかっこのデータサイエンティストがまとめました!/ なぜデータサイエンスは必要?

結論

結論

結論、データサイエンスによって最適な条件を設定した結果、友人たちの直感的な条件で探すよりも、103%~236%ほど多くの候補物件を探し出せました。

家探しの条件をデータサイエンスで最適なものにするだけで、直感だけでは候補に入らなかった物件まで候補に入れられるようになったのです。

それぞれのモデルケースでの「直感の条件とデータサイエンスによる条件」で設定した検索ヒット件数を比べてみると、以下のように差が出ました。

防犯面を気にする女性手ごろな家賃で津波の心配がない家を探す女性子育て中の若い女性セカンドライフを楽しみたい女性

どのモデルケースでも条件にあてはまる物件が増えていて、防犯がしっかりしているという条件を重視していても、平均家賃が低くなっていることが分かります。

このように、直感では見つけられなかった物件をデータから最適な条件を設定することで見つけられるのです。

では、それぞれどのような条件を設定したのかを以下に示します。

  • 友人の直感的な条件設定
モデルケース 条件
防犯面を気にする女性
  • 築15年未満
  • 徒歩5分未満
  • マンション
手ごろな値段で、津波の心配がない家を探す女性
  • 専有面積20m²未満
  • 徒歩10-30分
  • アパート
子育て中の若い女性
  • 築15-33年
  • 専有面積45m²以上
  • 徒歩5分未満
  • マンション
セカンドライフを楽しみたい女性
  • 築15年未満
  • 専有面積27-45m²
  • 徒歩10-30分
  • マンション
  • データサイエンスを用いた条件設定
モデルケース 条件
防犯面を気にする女性
  • 築15年未満
  • 専有面積20−27m²
  • 徒歩5−10分
手ごろな値段で、津波の心配がない家を探す女性
  • 築15−33年
  • 専有面積20m²未満
  • 徒歩5−10分
子育て中の若い女性
  • 築15−33年
  • 専有面積45m²以上
  • 徒歩5分未満
セカンドライフを楽しみたい女性
  • 築15年未満
  • 専有面積27-45m²
  • 徒歩10-30分

少しの違いですが、検索のヒット数として差が生まれるのです。

それでは、最適な条件にたどり着くまでの過程を順を追って説明していきます。

今回の分析に使用したデータ

データ分析で使用したデータ

今回の分析にあたり、SUUMO関東版から物件に関するデータを使用しました。(2021年4月28日時点)

湘南・鎌倉エリアでの部屋探しを想定しているため、江ノ島電鉄線沿線の物件を対象としてSUUMO関東版のサイトから取得しました。

部屋探しのために取得したデータの主な項目は以下の9つです。

  • 最寄り駅
  • 最寄りまでの徒歩時間
  • 築年数
  • 建物種別
  • 専有面積
  • 間取り
  • 向き
  • 家賃
  • 管理費

以上の項目は物件探しを行う上で必ず見るべきものになります。

また以上の項目以外にも、防犯面に絞って、以下の項目のデータも取得しました。

  • オートロック設置
  • 管理人在中
  • TVモニタ付きインターホン設置
  • 防犯カメラ設置
  • セキュリティ会社加入
  • 女性限定
  • 宅配ボックス設置
  • ディンプルキー搭載
  • ダブルロックキー搭載
  • 二階以上

防犯がしっかりしているのかも物件探しでは重要です。

そのため、以上の項目のうちが何個当てはまるのかを記録し、当てはまった項目の個数を物件の「防犯レベル」と定義します。

防犯レベルは、各物件に設置されているオートロックや防犯カメラなどの防犯設備の種類数も表しているので、各物件のセキュリティの高さを表せるのです。

6SLDKや8LDKの物件などのなかなか借りないと考えられる物件は除外しました。
また、家賃20万円以上の物件も非常に少ないため、除外しました。
それでは、分析内容を解説していきます。

防犯レベルと関係がある条件を見つけ出す

防犯レベルと関係がある条件を見つけ出す

物件を探すときに、防犯がどれだけしっかりしているのかを把握するのは重要になります。

今回のモデルケースは女性であることから防犯に対する意識が高いと考えて、防犯面を軸として物件を探す必要があるからです。

そのため、まずは物件探しの時に必ず見るべき以下の9つの項目を変化させたとき、どれだけ防犯レベルが変化するかを見ていきます。

  • 最寄り駅
  • 最寄りまでの徒歩時間
  • 築年数
  • 建物種別
  • 専有面積
  • 間取り
  • 向き
  • 家賃
  • 管理費

また、以上の項目を「カテゴリなどの文字で分けられる項目」と「〇分などの数字で表せる項目」にさらに分ける必要があります。

なぜなら、分析を行う時の見える化や分析方法が大きく変わってくるからです。

実際に分けると以下のようになります。

  • カテゴリなどの文字で分けられる項目(質的変数)
    • 建物種別
    • 最寄り駅
    • 向き
    • 間取り
  • 〇分などの数字で表せる項目(量的変数)
    • 最寄りまでの徒歩時間
    • 築年数
    • 専有面積
    • 家賃
    • 管理費

向きや間取りは防犯に関係がないと考えて、向き・間取りを除いた各項目をそれぞれ分析していきます。

  • 建物の種類
  • 最寄り駅の場所
  • その他の物件条件

その他の物件条件では「〇分などの数字で表せる項目」をまとめて分析します。

それでは、それぞれの項目の分析を解説していきます。

建物の種類

まず、建物の種類によって、防犯レベルがどう変わるのかについて見ていきます。

今回対象となる建物の種類は以下の通りです。

  • アパート
  • マンション
  • 一戸建て
  • テラス・タウンハウス
  • その他

以上の建物の種類それぞれに対して、箱ひげ図で防犯レベルの物件数の分布で表したのが下図になります。

箱ひげ図について詳しく知りたい方は『箱ひげ図を使うメリット・デメリットや実際の作り方を解説』の記事をご参照ください。

上図を見てもらうと、マンションが防犯レベルが高い傾向にあることが見て取れます。

このことから、マンションを中心に物件を探すと、防犯レベルが高い物件を探せる可能性が高いことが言えるでしょう。

最寄り駅の場所

最寄り駅についても、防犯レベルとの関係性を調べていきます。

今回は、湘南・鎌倉エリアに絞っているため、該当する最寄り駅は以下の通りです。

  • 鎌倉
  • 稲村ヶ崎
  • 極楽寺
  • 腰越
  • 七里ヶ浜
  • 長谷
  • 和田塚
  • 鵠沼
  • 藤沢
  • 由比ヶ浜
  • 石上
  • 江の島
  • 柳小路
  • 鎌倉高校前
  • 湘南海岸公園

以上の最寄り駅それぞれに対して、防犯レベルの物件数の分布を表したのが下図です。

箱ひげを見てみると、ほとんどの駅で防犯レベル3までの物件が多く、藤沢駅に少し防犯レベル4以上の物件が偏っていることが見て取れます。

なぜ防犯レベル4以上で境界線ができているのかについて、さらに分析を行いました。

防犯レベルに関わる防犯面の各項目について、積み上げ棒グラフで表すと以下のようになります。

上図を見ると、防犯レベルが3から4に上がることで、オートロックと防犯カメラの割合が増えているのが分かります。

とはいえ、箱ひげ図の箱の部分がどの駅でも防犯レベル3であることから、駅は絞り込まずに自由に選んでもよいと言えるでしょう。

それでは、その他の物件条件について分析していきます。

その他の物件条件

「カテゴリなどの文字で分けられる項目」の分析についてここまで解説してきました。

この章では、残りの5つの項目について防犯レベルとの関係性を見ていきます。

  • 徒歩時間:walk_minute
  • 築年数:ages
  • 専有面積:area
  • 家賃:fee
  • 管理費:maintainance_fees

それぞれの項目の防犯レベルについて物件数の分布を表したものが下図になります。

上図から、特に関係がありそうな

  • 徒歩時間
  • 築年数
  • 専有面積

の3つの項目について、関係性の深さを表す指標である相関係数で比較すると、

  1. 築年数
  2. 専有面積
  3. 徒歩時間

の順で防犯レベルと関係性が深いことがわかりました。

このように、防犯レベルと各項目を比較することで、条件としてどの項目を重視すべきなのかが分かるのです。

以下からは、建物の種類以外に重要な

  • 築年数
  • 専有面積
  • 徒歩時間

の3つの項目について、それぞれ最適な条件を深掘りしていきます。

重要な3つの項目の最適な条件をモデルケースごとに設定する

重要な3つの項目の最適な条件をモデルケースごとに設定する

それでは、3つの項目についてそれぞれのモデルケースについて最適な条件を設定していきます。

深掘りする3つの項目は以下の通りです。

  • ①築年数
  • ②専有面積
  • ③徒歩時間

それぞれ解説していきます。

①築年数

まず、築年数について、最適な条件を見つけ出していきます。

防犯レベルについて、築年数をx軸として分布を表したものが下図です。

上図を見てもらうと、築年数15年くらいで防犯レベル5、築年数33年くらいで防犯レベル3,4と境界があることが見て取れます。

そこで、築15年,33年とそれぞれ範囲を区切って「物件数や平均家賃・防犯レベル」を調べてみると、以下のようになりました。

築年数 物件数・平均家賃・平均防犯レベル
15年未満
  • 物件数:3639件
  • 平均家賃:8.1万円
  • 平均防犯レベル:2.56
15~33年
  • 物件数:3979件
  • 平均家賃:7.5万円
  • 平均防犯レベル:1.40
33年以上
  • 物件数:1872件
  • 平均家賃:6.1万円
  • 平均防犯レベル:1.06

以上の表から、平均家賃・平均防犯レベルはどちらも、築年数が経つほど下がっていくことが分かります。

表の情報から、各モデルケースにとって最適な築年数の条件を考えると、以下のようになります。

モデルケース 築年数の条件
防犯面を気にする女性 15年未満
手ごろな値段で、津波の心配がない家を探す女性 15−33年
子育て中の若い女性 15−33年
セカンドライフを楽しみたい女性 15年未満

築33年以上は最低限の防犯レベルでない可能性があると仮定して、手ごろな値段を求めるモデルケースでも「築15−33年」と条件を定めました。

また、防犯面が気になるモデルケースでは一番平均防犯レベルの高い築15年未満とします。

セカンドライフを楽しみたいモデルケースでも新しい家を求めている可能性が高いことから、築15年未満と条件を設定しました。

②専有面積

専有面積についても、条件を設定するためにまず範囲を区切りました。

専有面積について作成した棒グラフは下図の通りです。

上図の棒グラフを分布の山ごとに区切ると、20m², 27m² ,45m²とそれぞれ区切られました。

また、専有面積別であれば防犯カメラ数・南向き物件数にも大きな差が見られたため、それらの件数についてもまとめると以下のようになります。

専有面積 物件数・防犯カメラの有無・南向きかどうか・平均防犯レベル
20m²未満
  • 物件数:1875件
  • 防犯カメラ:453件
  • 南向き:241件
  • 平均防犯レベル:1.42
20~27m²
  • 物件数:2722件
  • 防犯カメラ:144件
  • 南向き:532件
  • 平均防犯レベル:2.24
27~45m²
  • 物件数:2548件
  • 防犯カメラ:437件
  • 南向き:699件
  • 平均防犯レベル:1.86
45m²以上
  • 物件数:3028件
  • 防犯カメラ:296件
  • 南向き:1097件
  • 平均防犯レベル:1.45

以上の表から、各モデルケースに最適な専有面積を考えてみると以下のようになります。

モデルケース 専有面積の条件
防犯面を気にする女性 20~27m²
手ごろな値段で、津波の心配がない家を探す女性 20m²未満
子育て中の若い女性 45m²以上
セカンドライフを楽しみたい女性 27~45m²

防犯面を気にする女性は防犯レベルが最も高い専有面積の条件、手ごろな値段がいい女性はとにかく安い最も専有面積が小さい条件が最適であると考えました。

また、子育て中の若い女性は、部屋が広くて南向きであるほど良いと仮定すると、45m²以上の専有面積が最適な条件になります。

セカンドライフを楽しみたい女性は、そこまで広い部屋を求めていないと考え、ある程度の広さがある27~45m²程度の専有面積を最適としました。

③徒歩時間

徒歩時間についても専有面積と同様に、1分刻みの棒グラフで見える化したところ、分布の山ごとに5分,10分,30分で区切られました。

徒歩時間を5分,10分,30分で区切り、徒歩時間別の物件数・平均防犯レベルをまとめた表が以下になります。

徒歩時間 物件数・平均防犯レベル
5分以内
  • 物件数:2865件
  • 平均防犯レベル:1.68
5~10分
  • 物件数:3176件
  • 平均防犯レベル:2.07
10~30分
  • 物件数:2720件
  • 平均防犯レベル:1.51
30分以上
  • 物件数:1412件
  • 平均防犯レベル:1.33

まず、徒歩30分以上の物件は、今回のテーマが移住によって「海と山を感じられる生活」を送ることを仮定していることからモデルケースの条件から省く必要があります。

なぜなら、徒歩時間30分以上は下図の薄いグレーの部分のように、海から離れている所が多いためです。

また、今回はモデルケースに津波の心配がない家を探している女性がいることから、想定津波到達区域も考える必要があります。

徒歩時間10分以内は濃いグレーの区域であり、青色で想定津波到達区域と重ね合わせた図が下図です。

徒歩時間10分以内を示す濃いグレーの区域に対し、薄いグレーの区域(徒歩時間30分未満)の方が津波が到達していないことが分かります。

以上のことから、津波のリスクをできる限り下げたいモデルケースの女性には、徒歩時間10分以上30分未満の物件が適していると言えるでしょう。

以上の分析から、各モデルケースの最適な徒歩時間は以下のようにまとめられます。

モデルケース 徒歩時間の条件
防犯面を気にする女性 5~10分
手ごろな値段で、津波の心配がない家を探す女性 10~30分
子育て中の若い女性 5分未満
セカンドライフを楽しみたい女性 10~30分

防犯面を気にする女性は防犯レベルが最も高い「5~10分」にし、子育て中の若い女性は長時間の移動ができないと考え「5分未満」としました。

セカンドライフを楽しみたい女性は利便性をあまり求めていないと考え、「10~30分」と条件が最適であると判断できます。

このように、それぞれの項目について分布を確認して考察することで、より詳細で最適な条件設定を行えるのです。

まとめ

今回は、「湘南鎌倉エリアでの物件探し」というテーマで、実際にデータサイエンスの技術を使ってデータ分析を行いました。

防犯面に大きく関係する項目を見つけ出して、箱ひげ図や棒グラフなどの基礎的な分布を確認することで、それぞれのモデルケースで以下のような条件を設定できます。

モデルケース 条件
防犯面を気にする女性
  • 築15年未満
  • 専有面積20−27m²
  • 徒歩5−10分
手ごろな値段で、津波の心配がない家を探す女性
  • 築15−33年
  • 専有面積20m²未満
  • 徒歩5−10分
子育て中の若い女性
  • 築15−33年
  • 専有面積45m²以上
  • 徒歩5分未満
セカンドライフを楽しみたい女性
  • 築15年未満
  • 専有面積27-45m²
  • 徒歩10-30分

この記事を通して、統計的に条件を設定していくことによって、より選択肢の幅の広い条件が得られることをお伝えしました。

たとえ、基礎的なグラフであったとしても、様々な角度から分析することで価値のある情報が得られます。

この記事を参考に、あなたの身の回りの地域でも家探しの条件を設定しましょう。

データサイエンスの活用事例をもっと知りたい方は『データサイエンスの活用事例まとめ|導入事例4選と必要な3つの準備』の記事もご参照ください。

ピックアップ記事

  1. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  2. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  3. こんなときには異常検知
  4. 学生をデータサイエンティストに育てる4つのポイント
  5. 知っておきたいAIの理想と現実

関連記事

  1. バレーボール データ分析のアイキャッチ画像

    データ分析例

    データサイエンスでバレーボールチームの戦術を考えてみた

    近年、ビジネス課題を解決するために、データを用いたアプローチがなされる…

  2. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみたのアイキャッチ画像

    データ分析例

    多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

    会話するきっかけになる映画の条件ってなに? どんな映画を…

  3. データ分析でメルカリ出品戦略を立てる-修正版

    データ分析例

    データ分析による読み終わった漫画のメルカリ出品戦略

    「初めてフリマアプリに出品するけど、適切な値段設定はいくらだろう?」…

  4. カリフォルニア 車 買う

    分析

    カリフォルニアで車を買う人必見!現地で安くトヨタ車を買うなら「カローラLE」一択である理由

    カリフォルニア大学サンタバーバラ校データサイエンス学部4年の鵜飼大輝で…

  5. 新宿 バイト 時給

    分析

    新宿区でバイトを募集する企業向けに、 参考時給を提⽰し時給の決定を⽀援する

    「新宿でバイトの募集をしたいけど、時給はいくらに設定すべき?」「新…

  6. 大阪 ホテル 価格相場のアイキャッチ画像

おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. インターン体験記

    大工からデータサイエンティストへ。かっこ株式会社での挫折と成長【インターン体験記…
  2. 分析

    コールセンター運営でやるべきデータ分析とは?3つのメリットと分析方法を徹底解説
  3. 需要予測のアイキャッチ画像

    分析

    需要予測とは?使える場面や予測の手法・注意点を徹底解説!
  4. 分析環境

    大きなデータを安全・便利にやり取りできるAmazonのクラウドストレージ活用法
  5. 趣味はゴルフです

    インターン体験記

    文系上がりの元営業マンによる、データサイエンスインターン挑戦記
PAGE TOP