インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

統計

データの関係性がパッと見でわかる「散布図」

散布図とは、2つのデータの関係性をパッと見ただけで把握することができるグラフです。

2つのデータがあったときに、その2つのデータの関係性を可視化して、関係性を把握し、示唆を得るために用いられます。

データ解析の際は、どんな要素が”利益”に貢献しているのかを大量のデータ間で比較検討しながら作業します。
その時、大量のデータをそのまま見ても、それはただのデータの羅列であり、そこから何かを発見したり、示唆を得ることはできません。

そのため、データ間の関係性をパッとみただけで把握することのできる散布図を数多く作り、データ解析を進めていきます。

この記事ではそんなデータ解析では欠かすことのできないグラフである「散布図」について紹介していきます。

散布図とは?? その作り方と見方

散布図は、「横軸」と「縦軸」、値を示す「点」で構成されるグラフです。
中学生のときに習った、x軸とy軸、座標の考え方と一緒です。
2つのデータについて、データの項目をそれぞれ x軸・y軸 として、1つ1つの値を座標としたものです。 

言葉だけではわかりにくいので、例えばこんな場合を考えてみましょう。
この表は、企業別のスマホ充電コードの値段とその利益金額を記載した架空のデータです。

 

商品名 販売価格(円) 利益金額(円)
A社の商品 880 390
B社の商品 1210 380
C社の商品 1300 400
D社の商品 1100 300
E社の商品 1200 360
F社の商品 1000 140
G社の商品 800 280
H社の商品 1000 330
I社の商品 1000 290
J社の商品 1300 410
K社の商品 850 280
L社の商品 1250 390
M社の商品 1500 500
N社の商品 700 190
O社の商品 1100 290

このデータを見ただけだは「販売価格」と「利益金額」の関係がいまいちわかりませんが、散布図を用いるとこれらの関係が一目で分かるようになります。

今回横軸(x軸)を販売価格、縦軸(y軸)を利益金額として散布図を作成していきます。
横軸と縦軸はこのようになります。

このグラフの中に、販売金額と利益金額の値の座標になる箇所に点を描いていきます。
例えばA社の商品は、販売価格が880円、利益金額が390円となっています。そのため、横軸が880、縦軸が390となるような線の交わる箇所に点を打ちます。

これをB社、C社、、、と繰り返していくことでこのような散布図が作成できます。

これで、散布図ができました。

さて、この散布図をよく見てください。販売価格が上がるにつれて、利益金額があがっていることを、パッと見ただけで把握することができます。

数字の羅列をみてるだけではわからなかった、販売価格と利益金額との関係性。散布図にすることにより、販売価格が高いものは、利益金額が高いという関係性が一目瞭然になりました。
まぁ、販売価格が高ければ、利益金額も高いというのはあたりまえっちゃあたり前な話かもしれませんね。

散布図から示唆をえる

さて、販売価格が高いものは利益金額が高いという関係性がひと目で見えるようになったのと同時に、商品によっては、販売価格と利益金額との関係性にばらつきがあることも把握できます。

例えば、散布図の青丸で囲まれている「A社」と「F社」に注目してください。

「A社」の商品は販売価格が同程度のものと比較して利益金額が高い、すなはち「利益率が高い」ことが見て取れます。
対して「F社」の商品は利益金額が低い、すなわち「利益率が低い」ことが分かります。

ここから、様々な可能性を推測することができます。
例えば、

  • A社は「原材料の仕入れ」を押さえて利益を高く出そうとしているのでは?
  • A社は「製造コスト」を押さえて利益を高く出そうとしているのでは?
  • A社の商品は単なるスマホ充電コードではなく、何かしらの付加価値があるのでは?
  • F社は「原材料の仕入れ」が弱く新規参入なのではないか?

2つの有用なデータと、その関連性をグラフに落とし込むことで、1つのデータだけでは考えることのできなかった様々な示唆を得ることができるようになります。
このような可能性をいくつも上げることができたら、それを仮説としてさらなるデータ分析を行っていくことも可能になります。

今回は架空のデータで話をしましたが、製造業におけるの商品別・工場別・ライン別の「作業時間と生産量」のデータであれば、生産効率を上げるための示唆を得ることができるのではないでしょうか。

他にも、販売における「会員ごとの購買回数と購買金額」のデータであれば、店に利益を多くもたらすユーザー層の特定や施策立案など幅広く活用することができそうです。

このように散布図は、2つのデータの関係性をパッと見ただけで把握することができ、さらに、そのデータの関係性からビジネスを推進するための様々な推測・仮説設定をおこなうことができる有用なツールだと言えるでしょう。

まとめ

散布図とは

  • 注目する2つのデータについて、ただのデータの羅列を眺めるだけでは見つけることのできない関係性を直感的に把握できるようになるグラフ
  • その関係性から得られる示唆は、データを用いたビジネスの判断材料のネタとなるもの

と言えます。

かっこ株式会社では、企業内で活用しきれていないデータであっても、分析を通じて、ビジネスに使える様々な判断材料を提供しています。

まずは、「かっこのデータサイエンス」にご相談ください。

かっこのデータサイエンス公式

ピックアップ記事

  1. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  2. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  3. 知っておきたいAIの理想と現実
  4. 学生をデータサイエンティストに育てる4つのポイント
  5. こんなときには異常検知

関連記事

  1. 統計

    起きることの必然性を統計学で裏付ける!「検定」の使い方!

    かっこ株式会社のデータサイエンス事業部でインターンをしている松中です。…

  2. 統計

    2種のデータの関係性を明らかにする「相関」のおはなし

    皆さんは「相関」という言葉を聞いたことがありますか??「相関」はデ…

  3. 統計

    確率を予測する「ロジスティック回帰」とは

    何らかの行動を起こす必要があるとき、「成功する確率」や「何をすれば成功…

  4. なんでも平均でいいの?

    統計

    なんでも平均でいいの?中央値と平均値をどう使い分けるか

    「なんでも平均でいいの?」「平均値や中央値ってどう使い分けるの?」…

  5. 統計

    データ分析の成果を大きく左右する「変数」って何だ?

    データ分析では、「変数(へんすう)」という言葉が当たり前のように使われ…

  6. 統計

    成果をあげるためのアクションに、優先順位を与えてくれる「オッズ比」の使い方

    みなさんオッズ比ってご存じでしょうか?売上や利益をあげるために…

おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. インターン体験記

    限界突破の連続!挑み続けたインターン生の成長記録
  2. 回帰分析とは のアイキャッチ画像

    分析

    回帰分析とは?基礎知識やできること【10分でできる手順付き】
  3. 統計

    2種のデータの関係性を明らかにする「相関」のおはなし
  4. 組織

    リモートワーク下でも学生インターンを主戦力としてバリバリ活用するための極意
  5. 統計学でできること

    統計

    統計学でできることとは?|統計学の基礎から活用事例まで完全解説!
PAGE TOP