散布図とは、2つのデータの関係性をパッと見ただけで把握することができるグラフです。
2つのデータがあったときに、その2つのデータの関係性を可視化して、関係性を把握し、示唆を得るために用いられます。
データ解析の際は、どんな要素が”利益”に貢献しているのかを大量のデータ間で比較検討しながら作業します。
その時、大量のデータをそのまま見ても、それはただのデータの羅列であり、そこから何かを発見したり、示唆を得ることはできません。
そのため、データ間の関係性をパッとみただけで把握することのできる散布図を数多く作り、データ解析を進めていきます。
この記事ではそんなデータ解析では欠かすことのできないグラフである「散布図」について紹介していきます。
散布図とは?? その作り方と見方
散布図は、「横軸」と「縦軸」、値を示す「点」で構成されるグラフです。
中学生のときに習った、x軸とy軸、座標の考え方と一緒です。
2つのデータについて、データの項目をそれぞれ x軸・y軸 として、1つ1つの値を座標としたものです。
言葉だけではわかりにくいので、例えばこんな場合を考えてみましょう。
この表は、企業別のスマホ充電コードの値段とその利益金額を記載した架空のデータです。
商品名 | 販売価格(円) | 利益金額(円) |
A社の商品 | 880 | 390 |
B社の商品 | 1210 | 380 |
C社の商品 | 1300 | 400 |
D社の商品 | 1100 | 300 |
E社の商品 | 1200 | 360 |
F社の商品 | 1000 | 140 |
G社の商品 | 800 | 280 |
H社の商品 | 1000 | 330 |
I社の商品 | 1000 | 290 |
J社の商品 | 1300 | 410 |
K社の商品 | 850 | 280 |
L社の商品 | 1250 | 390 |
M社の商品 | 1500 | 500 |
N社の商品 | 700 | 190 |
O社の商品 | 1100 | 290 |
このデータを見ただけだは「販売価格」と「利益金額」の関係がいまいちわかりませんが、散布図を用いるとこれらの関係が一目で分かるようになります。
今回横軸(x軸)を販売価格、縦軸(y軸)を利益金額として散布図を作成していきます。
横軸と縦軸はこのようになります。
このグラフの中に、販売金額と利益金額の値の座標になる箇所に点を描いていきます。
例えばA社の商品は、販売価格が880円、利益金額が390円となっています。そのため、横軸が880、縦軸が390となるような線の交わる箇所に点を打ちます。
これをB社、C社、、、と繰り返していくことでこのような散布図が作成できます。
これで、散布図ができました。
さて、この散布図をよく見てください。販売価格が上がるにつれて、利益金額があがっていることを、パッと見ただけで把握することができます。
数字の羅列をみてるだけではわからなかった、販売価格と利益金額との関係性。散布図にすることにより、販売価格が高いものは、利益金額が高いという関係性が一目瞭然になりました。
まぁ、販売価格が高ければ、利益金額も高いというのはあたりまえっちゃあたり前な話かもしれませんね。
散布図から示唆をえる
さて、販売価格が高いものは利益金額が高いという関係性がひと目で見えるようになったのと同時に、商品によっては、販売価格と利益金額との関係性にばらつきがあることも把握できます。
例えば、散布図の青丸で囲まれている「A社」と「F社」に注目してください。
「A社」の商品は販売価格が同程度のものと比較して利益金額が高い、すなはち「利益率が高い」ことが見て取れます。
対して「F社」の商品は利益金額が低い、すなわち「利益率が低い」ことが分かります。
ここから、様々な可能性を推測することができます。
例えば、
- A社は「原材料の仕入れ」を押さえて利益を高く出そうとしているのでは?
- A社は「製造コスト」を押さえて利益を高く出そうとしているのでは?
- A社の商品は単なるスマホ充電コードではなく、何かしらの付加価値があるのでは?
- F社は「原材料の仕入れ」が弱く新規参入なのではないか?
2つの有用なデータと、その関連性をグラフに落とし込むことで、1つのデータだけでは考えることのできなかった様々な示唆を得ることができるようになります。
このような可能性をいくつも上げることができたら、それを仮説としてさらなるデータ分析を行っていくことも可能になります。
今回は架空のデータで話をしましたが、製造業におけるの商品別・工場別・ライン別の「作業時間と生産量」のデータであれば、生産効率を上げるための示唆を得ることができるのではないでしょうか。
他にも、販売における「会員ごとの購買回数と購買金額」のデータであれば、店に利益を多くもたらすユーザー層の特定や施策立案など幅広く活用することができそうです。
このように散布図は、2つのデータの関係性をパッと見ただけで把握することができ、さらに、そのデータの関係性からビジネスを推進するための様々な推測・仮説設定をおこなうことができる有用なツールだと言えるでしょう。
まとめ
散布図とは
- 注目する2つのデータについて、ただのデータの羅列を眺めるだけでは見つけることのできない関係性を直感的に把握できるようになるグラフ
- その関係性から得られる示唆は、データを用いたビジネスの判断材料のネタとなるもの
と言えます。
かっこ株式会社では、企業内で活用しきれていないデータであっても、分析を通じて、ビジネスに使える様々な判断材料を提供しています。
まずは、「かっこのデータサイエンス」にご相談ください。