統計

利益爆増のためのアクションを発見!「カイ二乗検定」の可能性とは

データサイエンスという言葉を聞いてみなさんがまず期待するのは、「会社の利益爆増のためのアクションにつながる、新しい事実の発見」ではないでしょうか?

それこそ、まさにデータサイエンスの醍醐味ですよね。
今回は、その期待に応えられる統計学の「カイ二乗検定」についてご紹介します。
(検定については「起きることの必然性を統計学で裏付ける!「検定」の使い方!」をご覧ください)

カイ二乗検定とは

WEBデザインの変更によって、商品を購買したかどうか以下のような結果が出ています。
あなたはこの結果について、どう評価しますか?

カイ二乗検定は、上のような表(こういう2つのカテゴリーで集計した表をクロス集計表と呼びます。)について、この数値の偏りが「意味のある偏り」なのか、「誤差レベルの偏り」なのかを確かめることができるという手法です。

カイ二乗検定を行うと、クロス集計表に見られる数値の偏りが、誤差や偶然によって、たまたま生じる確率がわかります。
そして、慣例的にこの確率が5%より小さいとき、偶然ではなく「意味のある偏り」だったと判断できるのです。
(ちなみにこの確率が、統計学でよく耳にするp値になります。)

上記のクロス表に対してカイ二乗検定を実施すると、この100人の差は44.7%の確率で起きるという結果が得られます(p値が44.7%)。

つまり、これは誤差レベルでたまたま生じた偏りであり、旧デザインから新デザインにしたところで、商品の購買に対する効果は期待できない、という結論を得たことになります。

それでは、次のクロス表を見てみましょう。


上のクロス表には300人の差がありますが、この差が起きる確率は2.3%です。
つまり、(p値=2.3%<5%)なので、今度は、商品の購買増に、デザイン変更の効果はあった、という結論が明らかになりました。
 
カイ二乗検定が非常に使いやすいのは、データの偏りに対して客観的かつ統一的な視点から答えを与えてくれることです。
カイ二乗検定を使う事で、
経験や勘による仮説を裏付けたり、使っていなかったデータから利益につながる、新たな事実を発見できる可能性があります。

利益をあげる「カイ二乗検定」の使い方

クロス集計さえできれば、どんなことでも分析できます。
となると、次にこういう疑問がでるのではないでしょうか。
 
どういうデータを分析をすればいいの?
何と何をクロス集計するべき?
定石は、あるの?

その答えは実にシンプルです。

「目的を遂げたもの」「そうでないもの」で分けてクロス集計をしてみましょう。

ビジネスでいうと例えば、「買った」か、「買わなかった」か、のように利益につながる結果の有無、で整理するのがわかりやすいでしょう。 

RFM分析では、優良顧客と、課題のある顧客いうように顧客を分けることができました。

これに対し、優良顧客と、そうでない顧客で何が違うのか、優良顧客を増やすために必要な体験は何か、顧客データや販売データを隅から隅まで使ったクロス集計を基に、「カイ二乗検定」を使えば、促すべきアクションを抽出することが出来ます。

また、POSデータから優良顧客がこぞって購入しているような商品を特定し、どんな商品を積極的に売り出していけばいいのか、ヒントを得ることも出来るでしょう。

 最後に

カイ二乗検定は、

「目的を遂げたもの」「そうでないもの」のデータを基に、「目的達成」につながる「新たな事実」を発見する手法です。

実は、カイ二乗検定は、Excelでも簡単に試してみることが出来ます。

ただし、
検定の結果は、ふたつの事象の間に起きたことの「差」を明らかにするだけであって、因果関係ではないという事に注意が必要です。

 さて、新しいチャレンジのきっかけを客観的に作ってくれる「カイ二乗検定」の可能性について、興味をもっていただけたでしょうか?
 かっこの「さきがけKPI」というサービスでは
1億件のデータまでなら、目的に応じたクロス集計、カイ二乗検定を用いた目的達成のためのアクション抽出、課題にあわせた分析を、30営業日、200万円のローコストでご提供しています。

ぜひ、かっこのデータサイエンスにご相談ください。

さきがけKPI


ピックアップ記事

  1. 知っておきたいAIの理想と現実
  2. こんなときには異常検知
  3. 学生をデータサイエンティストに育てる4つのポイント
  4. 優良顧客を見つける「RFM分析」の考え方と使い方
  5. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

関連記事

  1. 統計

    2種のデータの関係性を明らかにする「相関」のおはなし

    皆さんは「相関」という言葉を聞いたことがありますか??「相関」はデ…

  2. 統計

    優良顧客を見つける「RFM分析」の考え方と使い方

    RFM分析とは小売、サービス業界における顧客分析の1つです。Recen…

  3. 統計

    統計学が得意なこと

    かっこのデータサイエンスサービスで、よく使っている技術として、統計や機…

  4. 統計

    箱ひげ図 について超カンタンに解説してみた

    「箱ひげ図」ということば、聞いたことや見たことはあるけど、見方がわから…

  5. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!

    かっこ株式会社のデータサイエンス事業部でインターンをしている松中です。…

  6. 統計

    こんなときには異常検知

    データを観測・解析していくと、ごく少数現れる特異な状態に気づくことがし…

カテゴリー

おすすめ記事

  1. 確率を予測する「ロジスティック回帰」とは
  2. データサイエンスを現場の敵にしないために
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. 箱ひげ図 について超カンタンに解説してみた
  5. 知っておきたいAIの理想と現実
  1. topics

    データで判断! エンジニアの沖縄移住、おすすめエリア
  2. 組織

    学生をデータサイエンティストに育てる4つのポイント
  3. internship

    データサイエンス専門外の学生も挑戦できるインターン
  4. 分析

    マーケティングから不正検知まで、データの理解と意思決定を助けてくれる「クラスタリ…
  5. 統計

    成果をあげるためのアクションに、優先順位を与えてくれる「オッズ比」の使い方
PAGE TOP