統計

データの関係性がパッと見でわかる「散布図」

散布図とは、2つのデータの関係性をパッと見ただけで把握することができるグラフです。

2つのデータがあったときに、その2つのデータの関係性を可視化して、関係性を把握し、示唆を得るために用いられます。

申し遅れました、かっこ株式会社のインターンの松中です。
かっこ株式会社のインターンでは、ただの雑用ではなく、社員の方々と共にお客様のデータを用いたデータ解析をしています。
データ解析の際は、どんな要素が”利益”に貢献しているのかを大量のデータ間で比較検討しながら作業します。
その時、大量のデータをそのまま見ても、それはただのデータの羅列であり、そこから何かを発見したり、示唆を得ることはできません。

そのため、データ間の関係性をパッとみただけで把握することのできる散布図を数多く作り、データ解析を進めていきます。

この記事ではそんなデータ解析では欠かすことのできないグラフである「散布図」について紹介していきます。

散布図とは?? その作り方と見方

散布図は、「横軸」と「縦軸」、値を示す「点」で構成されるグラフです。
中学生のときに習った、x軸とy軸、座標の考え方と一緒です。
2つのデータについて、データの項目をそれぞれ x軸・y軸 として、1つ1つの値を座標としたものです。 

言葉だけではわかりにくいので、例えばこんな場合を考えてみましょう。
この表は、企業別のスマホ充電コードの値段とその利益金額を記載した架空のデータです。

 

商品名 販売価格(円) 利益金額(円)
A社の商品 880 390
B社の商品 1210 380
C社の商品 1300 400
D社の商品 1100 300
E社の商品 1200 360
F社の商品 1000 140
G社の商品 800 280
H社の商品 1000 330
I社の商品 1000 290
J社の商品 1300 410
K社の商品 850 280
L社の商品 1250 390
M社の商品 1500 500
N社の商品 700 190
O社の商品 1100 290

このデータを見ただけだは「販売価格」と「利益金額」の関係がいまいちわかりませんが、散布図を用いるとこれらの関係が一目で分かるようになります。

今回横軸(x軸)を販売価格、縦軸(y軸)を利益金額として散布図を作成していきます。
横軸と縦軸はこのようになります。

このグラフの中に、販売金額と利益金額の値の座標になる箇所に点を描いていきます。
例えばA社の商品は、販売価格が880円、利益金額が390円となっています。そのため、横軸が880、縦軸が390となるような線の交わる箇所に点を打ちます。

これをB社、C社、、、と繰り返していくことでこのような散布図が作成できます。

これで、散布図ができました。

さて、この散布図をよく見てください。販売価格が上がるにつれて、利益金額があがっていることを、パッと見ただけで把握することができます。

数字の羅列をみてるだけではわからなかった、販売価格と利益金額との関係性。散布図にすることにより、販売価格が高いものは、利益金額が高いという関係性が一目瞭然になりました。
まぁ、販売価格が高ければ、利益金額も高いというのはあたりまえっちゃあたり前な話かもしれませんね。

散布図から示唆をえる

さて、販売価格が高いものは利益金額が高いという関係性がひと目で見えるようになったのと同時に、商品によっては、販売価格と利益金額との関係性にばらつきがあることも把握できます。

例えば、散布図の青丸で囲まれている「A社」と「F社」に注目してください。

「A社」の商品は販売価格が同程度のものと比較して利益金額が高い、すなはち「利益率が高い」ことが見て取れます。
対して「F社」の商品は利益金額が低い、すなわち「利益率が低い」ことが分かります。

ここから、様々な可能性を推測することができます。
例えば、

  • A社は「原材料の仕入れ」を押さえて利益を高く出そうとしているのでは?
  • A社は「製造コスト」を押さえて利益を高く出そうとしているのでは?
  • A社の商品は単なるスマホ充電コードではなく、何かしらの付加価値があるのでは?
  • F社は「原材料の仕入れ」が弱く新規参入なのではないか?

2つの有用なデータと、その関連性をグラフに落とし込むことで、1つのデータだけでは考えることのできなかった様々な示唆を得ることができるようになります。
このような可能性をいくつも上げることができたら、それを仮説としてさらなるデータ分析を行っていくことも可能になります。

今回は架空のデータで話をしましたが、製造業におけるの商品別・工場別・ライン別の「作業時間と生産量」のデータであれば、生産効率を上げるための示唆を得ることができるのではないでしょうか。

他にも、販売における「会員ごとの購買回数と購買金額」のデータであれば、店に利益を多くもたらすユーザー層の特定や施策立案など幅広く活用することができそうです。

このように散布図は、2つのデータの関係性をパッと見ただけで把握することができ、さらに、そのデータの関係性からビジネスを推進するための様々な推測・仮説設定をおこなうことができる有用なツールだと言えるでしょう。

まとめ

散布図とは

  • 注目する2つのデータについて、ただのデータの羅列を眺めるだけでは見つけることのできない関係性を直感的に把握できるようになるグラフ
  • その関係性から得られる示唆は、データを用いたビジネスの判断材料のネタとなるもの

と言えるでしょう。

 

かっこ株式会社では、企業内で活用しきれていないデータであっても、分析を通じて、ビジネスに使える様々な判断材料を提供しています。

まずは、「かっこのデータサイエンス」にご相談ください。

ピックアップ記事

  1. 学生をデータサイエンティストに育てる4つのポイント
  2. 優良顧客を見つける「RFM分析」の考え方と使い方
  3. こんなときには異常検知
  4. 知っておきたいAIの理想と現実
  5. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

関連記事

  1. 統計

    データ分析の成果を大きく左右する「変数」って何だ?

    データ分析では、「変数(へんすう)」という言葉が当たり前のように使われ…

  2. 統計

    度数分布表から、データの傾向を把握しよう

    皆さんは『度数分布表』という言葉を聞いたことはありますか?初めて耳…

  3. 統計

    成果をあげるためのアクションに、優先順位を与えてくれる「オッズ比」の使い方

    みなさんオッズ比ってご存じでしょうか?売上や利益をあげるために…

  4. 統計

    利益爆増のためのアクションを発見!「カイ二乗検定」の可能性とは

    データサイエンスという言葉を聞いてみなさんがまず期待するのは、「会社の…

  5. 統計

    なんでも平均でいいの?

    子どもの頃から馴染みがあって、使いやすいため、「平均」ということばは、…

  6. 統計

    こんなときには異常検知

    データを観測・解析していくと、ごく少数現れる特異な状態に気づくことがし…

カテゴリー

おすすめ記事

  1. 確率を予測する「ロジスティック回帰」とは
  2. データサイエンスを現場の敵にしないために
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. 箱ひげ図 について超カンタンに解説してみた
  5. 知っておきたいAIの理想と現実
  1. 組織

    学生をデータサイエンティストに育てる4つのポイント
  2. 統計

    こんなときには異常検知
  3. 分析

    まずはやってみよう!マーケティングでデータ分析!③顧客分析
  4. topics

    データ分析を使って、東急東横線沿線で楽器弾きのための家探しをしてみた
  5. RPA

    面倒な作業は機械にやらせよう、RPAのおはなし
PAGE TOP