インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

機械学習

決定木でデータドリブンに、ビジネスを成功させる判断基準を作ろう

「決定木」とは、なぜその結果になるのかを「論理的」に説明してくれる便利な機械学習の手法です。
「決定木」で示された判断のプロセスをたどることで、様々な業務改善に役立てることが期待できます。

例えば、

  • 人やモノ、お金を動かす際に、根拠の説明が必要な課題をベストな方法で解決させたい
  • 熟練者が経験的に判断している「根拠」を数値的に、明らかにしてナレッジにしたい

といったテーマに応えてくれるだけでなく、従来のビジネス上で、個々の担当者が持っている経験や、知見を越えた「意外な」判断材料を過去の実績データを学習した結果から、与えてくれる手法なのです。

それでは、もう少し、詳しく説明していきましょう。

決定木とは

決定木(決定木分析とも言います)とは機械学習手法の一つで、分類や値の予測に使うことができます。

決定木の特徴として面白いのは、分類・予測の結果以外に「樹形図」と呼ばれる、「その判断結果に到るまでに辿った条件分岐」を出力できることです。

条件の分岐が出力できることから分かる通り、決定木による判断結果は完全に論理的に説明がつきます。

この点が、論理的な説明がつかない、ディープラーニング等の機械学習の手法とは対照的なところです。

知っておきたいAIの理想と現実 | かっこデータサイエンスぶろぐ

決定木の樹形図は判断基準そのもの

決定木で出力できる「樹形図」は機械的に抽出された判断基準が可視化されたものだと言えます。

この樹形図は、データを学習し、人間の主観を排して導き出されたものであるため、時には人間では思いつかないような判断基準を見つけることができます。

樹形図の具体例として、ECサイトの不正取引を予測する例で説明します。
(かっこは不正検知サービスを運営しているのです)

変数としては、「注文金額」、「国内からの注文か」、「以前に不正があった住所か」等が考えられます。

これらの変数及びその取引が不正であったか否かを含むデータを用いて決定木分析をしてやると、以下のような樹形図が作成できます。(注文金額の閾値は学習の過程で自動的に決定されます)

 

この樹形図から、各条件を組み合わせて捉えられる取引がどのくらいの数存在し、その内の何%が不正であるのか、という情報が得られます。

この情報を元にすれば、どのくらいの精度でどの程度の不正を止めることができるのかが分かり、不正取引を審査するのに役立つ、新たな判断基準作成の強力な武器になります。

「決定木」が、人間の経験に頼ることなく、データから、判断基準を作成する手法であることが、お分かりいただけたかと思います。

まとめ

決定木分析で出力できる樹形図を用いることによって、データドリブンに判断基準が作成できることを説明しました。

さらに定期的な分析により、判断基準の自動チューニングまで実装できるような可能性もあります。

ブラックボックスで説明がつかない機械学習の手法とは異なり、説明が必要な課題の解決に、従来の経験を越えた判断基準を与えてくれる「決定木分析」。

いかがだったでしょうか?

  • 人やモノ、お金を動かす際に、根拠の説明が必要な課題をベストな方法で解決させたい
  • 熟練者が経験的に判断している「根拠」を数値的に、明らかにしてナレッジにしたい

と、いったテーマに応えてくれるのはもちろん。

従来のビジネス上で、個々の担当者が持っている経験や、知見を越えた「意外な」判断材料を過去の実績データを学習することで、明らかにできる「決定木」を、試してみませんか?

かっこでは1億レコードまでのデータであれば、お手軽にデータ分析をはじめられる「さきがけKPI」というサービスを提供していますので、お気軽にご相談ください。

さきがけKPI

ピックアップ記事

  1. 学生をデータサイエンティストに育てる4つのポイント
  2. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  3. 知っておきたいAIの理想と現実
  4. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  5. こんなときには異常検知

関連記事

  1. 機械学習

    知っておきたいAIの理想と現実

    機械学習・AIは、近年、ビジネス側からの期待が非常に大きな、熱い分野に…


おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. NFL ドラフト アイキャッチ画像

    データ分析例

    大学時代の戦績からNFLのドラフト順位を予測してみた
  2. 統計

    データ分析の成果を大きく左右する「変数」って何だ?
  3. 標準偏差のアイキャッチ画像 (1)

    統計

    標準偏差とは?データを見るなら知っておくべき求め方や目安
  4. インターン体験記

    就活で話すことには困らないかっこのインターンシップ経験!
  5. 2024年問題 とは

    最適化

    2024年問題とは?物流業界への影響や解決策を分かりやすく解説!
PAGE TOP