インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

統計

利益爆増のためのアクションを発見!「カイ二乗検定」の可能性とは

データサイエンスという言葉を聞いてみなさんがまず期待するのは、「会社の利益爆増のためのアクションにつながる、新しい事実の発見」ではないでしょうか?

それこそ、まさにデータサイエンスの醍醐味ですよね。
今回は、その期待に応えられる統計学の「カイ二乗検定」についてご紹介します。
(検定については「起きることの必然性を統計学で裏付ける!「検定」の使い方!」をご覧ください)

カイ二乗検定とは

WEBデザインの変更によって、商品を購買したかどうか以下のような結果が出ています。
あなたはこの結果について、どう評価しますか?

カイ二乗検定は、上のような表(こういう2つのカテゴリーで集計した表をクロス集計表と呼びます。)について、この数値の偏りが「意味のある偏り」なのか、「誤差レベルの偏り」なのかを確かめることができるという手法です。

カイ二乗検定を行うと、クロス集計表に見られる数値の偏りが、誤差や偶然によって、たまたま生じる確率がわかります。
そして、慣例的にこの確率が5%より小さいとき、偶然ではなく「意味のある偏り」だったと判断できるのです。
(ちなみにこの確率が、統計学でよく耳にするp値になります。)

上記のクロス表に対してカイ二乗検定を実施すると、この100人の差は44.7%の確率で起きるという結果が得られます(p値が44.7%)。

つまり、これは誤差レベルでたまたま生じた偏りであり、旧デザインから新デザインにしたところで、商品の購買に対する効果は期待できない、という結論を得たことになります。

それでは、次のクロス表を見てみましょう。


上のクロス表には300人の差がありますが、この差が起きる確率は2.3%です。
つまり、(p値=2.3%<5%)なので、今度は、商品の購買増に、デザイン変更の効果はあった、という結論が明らかになりました。
 
カイ二乗検定が非常に使いやすいのは、データの偏りに対して客観的かつ統一的な視点から答えを与えてくれることです。
カイ二乗検定を使う事で、
経験や勘による仮説を裏付けたり、使っていなかったデータから利益につながる、新たな事実を発見できる可能性があります。

利益をあげる「カイ二乗検定」の使い方

クロス集計さえできれば、どんなことでも分析できます。
となると、次にこういう疑問がでるのではないでしょうか。
 
どういうデータを分析をすればいいの?
何と何をクロス集計するべき?
定石は、あるの?

その答えは実にシンプルです。

「目的を遂げたもの」「そうでないもの」で分けてクロス集計をしてみましょう。

ビジネスでいうと例えば、「買った」か、「買わなかった」か、のように利益につながる結果の有無、で整理するのがわかりやすいでしょう。 

RFM分析では、優良顧客と、課題のある顧客いうように顧客を分けることができました。

これに対し、優良顧客と、そうでない顧客で何が違うのか、優良顧客を増やすために必要な体験は何か、顧客データや販売データを隅から隅まで使ったクロス集計を基に、「カイ二乗検定」を使えば、促すべきアクションを抽出することが出来ます。

また、POSデータから優良顧客がこぞって購入しているような商品を特定し、どんな商品を積極的に売り出していけばいいのか、ヒントを得ることも出来るでしょう。

 最後に

カイ二乗検定は、

「目的を遂げたもの」「そうでないもの」のデータを基に、「目的達成」につながる「新たな事実」を発見する手法です。

実は、カイ二乗検定は、Excelでも簡単に試してみることが出来ます。

ただし、
検定の結果は、ふたつの事象の間に起きたことの「差」を明らかにするだけであって、因果関係ではないという事に注意が必要です。

 さて、新しいチャレンジのきっかけを客観的に作ってくれる「カイ二乗検定」の可能性について、興味をもっていただけたでしょうか?
 かっこの「さきがけKPI」というサービスでは
1億件のデータまでなら、目的に応じたクロス集計、カイ二乗検定を用いた目的達成のためのアクション抽出、課題にあわせた分析を、30営業日、200万円のローコストでご提供しています。

ぜひ、かっこのデータサイエンスにご相談ください。

さきがけKPI


ピックアップ記事

  1. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  2. 学生をデータサイエンティストに育てる4つのポイント
  3. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  4. こんなときには異常検知
  5. 知っておきたいAIの理想と現実

関連記事

  1. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!

    かっこ株式会社のデータサイエンス事業部でインターンをしている松中です。…

  2. 統計

    2種のデータの関係性を明らかにする「相関」のおはなし

    皆さんは「相関」という言葉を聞いたことがありますか??「相関」はデ…

  3. 統計

    データの関係性がパッと見でわかる「散布図」

    散布図とは、2つのデータの関係性をパッと見ただけで把握することができる…

  4. 度数分布表のアイキャッチ画像

    統計

    5分で分かる度数分布表|平均値などの求め方やエクセルでの作成手順

    度数分布表とはデータを決められた範囲ごとに分割し集計したものです。本記…

  5. 統計

    データ分析の成果を大きく左右する「変数」って何だ?

    データ分析では、「変数(へんすう)」という言葉が当たり前のように使われ…

  6. 統計

    確率を予測する「ロジスティック回帰」とは

    何らかの行動を起こす必要があるとき、「成功する確率」や「何をすれば成功…


おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. データ分析でメルカリ出品戦略を立てる-修正版

    データ分析例

    データ分析による読み終わった漫画のメルカリ出品戦略
  2. 統計

    こんなにも使える、単純集計とクロス集計の活用法
  3. 売上分析のアイキャッチ画像

    分析

    売上分析とは?未来の戦略を練るための方法3選
  4. 統計

    確率を予測する「ロジスティック回帰」とは
  5. 組織

    リモートワーク下でも学生インターンを主戦力としてバリバリ活用するための極意
PAGE TOP