統計

こんなときには異常検知

データを観測・解析していくと、ごく少数現れる特異な状態に気づくことがしばしばあります。
例えば、 サーバーの不正アクセスなんかもそうですよね。

普通の状態と、この特異な状態を線引きし、特異な状態が現れたときに、検知してくれる方法として「異常検知」というものがあります。

異常検知とは

“異常”という物々しい言い方ですが、要するに一般的に得られるであろう値よりも大幅に外れた値をもつデータを抽出する手法になります。例えば全国の高校生の偏差値は正規分布で平均値が50で標準偏差が10になります。

偏差値が平均値+標準偏差の2倍=70以上であるデータは、群を抜いている。すごく成績が良いわけですが、全体から見ると異常値として抽出することができます。

上位2.3%の成績の人を異常値と言うのは失礼な話かもしれませんが(笑)。
偏差値についてはこちら

今回は、標準偏差の「2倍」で異常値を説明しましたが、実際には抽出したい割合や件数等に合わせて基準を変えて使います。

例えば製造業では3倍など、業界毎で慣習があったりします。

(正確には上記の説明は異常検知のうちの「外れ値検知」と呼ばれるものの説明になります。時系列データの異常についてはまた別の考え方が存在します)

どんな時に使える?

「通常とは異なった振る舞いや状態を持つような一部のデータを抽出したい」というようなニーズがあれば、それは異常検知の出番かもしれません。

具体例としては以下のようなものが挙げられます

  • 製造業における、不良品発生の検知
  • 生産設備やセンサーの故障の検知
  • サーバーの不正アクセス検知
  • 不正送金の検知
  • EC業界における不正注文の検知
  • 脈拍データから不整脈を検知
  • 医療画像から病理診断

かっこでの活用例

かっこではECサイト等の不正注文を検知するサービスであるO-PLUXを提供しています。

O-PLUXの精度を高めていくためには、日々変化する不正手法をモニタリングで見つけていくことが重要になります。
そのモニタリングの起点として、「通常とは異なる取引傾向となっている注文群」を異常検知の手法を用いて抽出することで、新たな手口の不正発見に役立てています。

「ある地区における1週間の注文群」は通常このような分布であり、それと大きく外れている注文群は異常≒不正な取引なのでは?という考え方を取り入れることで、異常検知手法をモニタリングに活用できるようになりました。

まとめ

異常検知は通常とは異なった振る舞いや状態を持つような一部のデータを抽出したいときに、幅広く活用できる技術である。

この記事を読んで、
「ウチでいうとあそこに異常検知を適用してみたら良いのでは?」
とか
「通常の機械学習的なアプローチでは上手く行かなかったけど、異常検知のアプローチなら結果が出せるのかも?」
と思ってもらえたら幸いです。

異常検知を業務に取り入れたくなったら、ぜひ、かっこのデータサイエンスまで、ご相談ください。

ピックアップ記事

  1. 知っておきたいAIの理想と現実
  2. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. こんなときには異常検知
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. 統計

    ヒストグラム 〜経営の現状を見える化する超強力なグラフ

    データ解析でよく利用されるグラフの1つに、「ヒストグラム」という現状を…

  2. 統計

    箱ひげ図 について超カンタンに解説してみた

    「箱ひげ図」ということば、聞いたことや見たことはあるけど、見方がわから…

  3. 統計

    データをみるなら知っておきたい!標準偏差!

    かっこ株式会社のデータサイエンス事業部でインターンをしている松本です。…

  4. 統計

    利益爆増のためのアクションを発見!「カイ二乗検定」の可能性とは

    データサイエンスという言葉を聞いてみなさんがまず期待するのは、「会社の…

  5. 統計

    成果をあげるためのアクションに、優先順位を与えてくれる「オッズ比」の使い方

    みなさんオッズ比ってご存じでしょうか?売上や利益をあげるために…

  6. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!

    かっこ株式会社のデータサイエンス事業部でインターンをしている松中です。…

カテゴリー

おすすめ記事

  1. 優良顧客を見つける「RFM分析」の考え方と使い方
  2. 知っておきたいAIの理想と現実

メディア注目ワード

  1. topics

    大学時代の成績からNFLのドラフト順位を予測してみた
  2. 統計

    データをみるなら知っておきたい!標準偏差!
  3. 統計

    なんでも平均でいいの?
  4. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!
  5. 統計

    優良顧客を見つける「RFM分析」の考え方と使い方
PAGE TOP