「統計学でできることって何?」
「そもそも統計学とは?」
「統計学の活用例は?」
と気になりませんか。
統計学とは、データを数字を使って物事を論理的に説明するための学問です。
統計学を活用することで、データの特徴や傾向を把握したり、近い未来を予測したりできるため、ビジネスの意思決定にも活用されています。
この記事では、
- 統計学でできること5つ
- 統計学の3つの活用例
などについて解説していきますので、ぜひ参考にしてください。
\経験豊富なかっこのデータサイエンティストがまとめました!/
目次
統計学とは「データを数字を使ってわかりやすく説明するための」学問
統計学は、データから導いた「数字」を使って物事をわかりやすく説明するための学問です。
統計学を活用することで、データの傾向やパターンを把握でき、表やグラフで人にもデータを分かりやすく説明できます。
例えば、統計学は以下のような場面で活用されています。
- 治験のデータから新薬の効果を評価する
- 経済データから景気の動向や株価の予測を行う
これらの場面以外にも、日常・ビジネスを問わず、様々な場面で統計学は利用されています。
また、統計学を活用することで、データに基づいて意思決定を行えるので、客観的に物事を判断できるようになるのです。
データサイエンティストやデータアナリストといった専門職だけでなく、ビジネスパーソンや研究者にとっても必須のスキルとなっています。
統計学でできること5つ
統計学はデータをわかりやすく説明するための学問であるため、様々なことに活用されています。
統計学でできることは以下の5つです。
- データの特徴を数値化して把握できる
- データの特徴や傾向をグラフや図で見える化できる
- データから近い未来を予測できる
- データ同士の関係性を把握できる
- データを分類できる
以上のように様々なことができることから、統計学はビジネスや普段の生活など、色々な場面で使われるのです。
それでは、それぞれ解説していきます。
①データの特徴を数値化して把握できる
まず、統計学を使えば、データの特徴を数値として説明できます。
なぜなら、平均値や中央値、最頻値などの数値を計算することで、データ全体の傾向をカンタンに把握できるからです。
実際に、統計学では以下のような指標をデータから把握します。
- 平均値:データの合計を個数で割った値
- 中央値:データを大きさ順に並べた時の中央の値
- 最頻値:データの中で最も頻繁に現れる値
- 分散:データのばらつきを表す指標 etc.
以上のような指標を計算することで、直感的にデータの特徴を理解できるのです。
また、データを指標で数値化することで、データ同士の比較や分析がしやすいというメリットもあります。
数値化する際は、データの特性に合わせて適切な指標を選ぶようにしましょう。
②データの特徴や傾向をグラフや図で見える化できる
また、統計学では、データの傾向をグラフや図で視覚的に分かりやすく説明することも可能です。
数値だけを見ても理解しにくいデータの特徴も、グラフや図で見える化することで人がカンタンに理解できるようになるのです。
統計で使われる代表的なグラフとしては以下のようなものがあります。
- 棒グラフ:カテゴリごとの数量を棒の長さで表現したもの
- 折れ線グラフ:時系列データの変化を線で表現したもの
- 円グラフ:全体に対する割合を円の面積で表現したもの
- 散布図:2つの変数の関係性を点の分布で表現したもの
- 箱ひげ図:データの分布を「箱」と「ひげ」で表現したもの
データの特徴に応じて、適切なグラフで見える化することで、データの傾向や特徴を直感的に伝えられます。
また、図を用いることで、データの異常値なども一目で発見しやすくなるのです。
③データから近い未来を予測できる
統計学の手法を使えば、過去のデータから近い未来もある程度の精度で予測できます。
回帰分析や時系列分析といった統計学の手法を用いることで、データの傾向を数式で表せるため未来の値を推定できるのです。
例えば、以下のような予測が可能になります。
- 売上データから来月の売上を予測する
- 気温データから明日の気温を予測する
- 株価データから明日の株価を予測する
ある程度の予測ができることによって、先を見据えた意思決定やリスク管理ができるようになります。
ただし、予測はあくまで予測ですので、完璧な未来予知ではないことに注意してください。
しかし、リスク管理の面では役に立つので、ぜひ活用してみましょう。
④データ同士の関係性を把握できる
複数のデータ同士の関係性を客観的に把握することも統計学は得意です。
相関分析や回帰分析などの手法を用いることで、データ同士の関係性の強さを把握できます。
具体的には以下のようなことが分かります。
- 身長と体重の関係性を把握できる
- 気温と飲料の売上の関係性の強さを調べられる
データ同士の関係性が把握できることで、ビジネスなどでは次の意思決定の判断材料になるのです。
例えば、気温とアイスの売上に関係性があると分かれば、さらに深掘って調査しようと意思決定が行えます。
ただし、相関関係があっても因果関係があるとは限らないので、注意が必要です。
⑤データを分類できる
統計学の手法を使えば、データを特徴に基づいてグループ分けすることもできます。
クラスター分析の手法を用いることで、データを分類して、グループごとの特徴を把握できるのです。
例えば、以下のようなデータの分類が可能になります。
- 顧客データを購買行動に基づいて分類する
- 商品データを商品の特徴に基づいて分類する
以上のように、データを分類できることで、それぞれのグループごとで違う行動を取れるようになるのです。
例えば、顧客を「優良顧客・普通顧客・離反顧客」に分類できれば、優良顧客だけに広告を打ち出すことも可能になります。
また、分類結果を分析することで、新たな意味ある情報も得られるようになるのです。
統計学の3つの活用例
先ほど説明したように、統計学を活用することで、様々なことができます。
ビジネスにおいても統計学を活用することで、より正確な予測や分析ができるようになるのです。
統計学が活用できる具体的な場面は以下の3つがあります。
- 新商品の需要予測をする
- 商品の売上と関係のある項目を見つけられる
- 顧客を属性で分類する
それぞれ詳しく解説していきます。
例1. 新商品の需要予測をする
統計学を使うことで、新商品の需要予測をある程度の精度で行えるため、在庫管理や生産計画に役立てられます。
回帰分析という統計学の手法を用いることで、過去のデータから需要をある程度の精度で推定できるのです。
例えば、以下のようなデータを使って需要予測を行います。
- 類似商品の過去の需要実績データ
- 市場調査によって得られた潜在的な顧客のデータ
- 季節や景気など、需要数に影響を与える外的要因のデータ
以上のデータを統計的に分析することで、ある程度の精度で需要予測が可能になります。
需要予測をある程度行えれば、機会損失を減らしたり、在庫リスクを下げたりすることにも繋がるのです。
ビジネスの様々な場面で需要予測が必要になってくるため、統計学の手法である回帰分析は必ず押さえておきましょう。
回帰分析について詳しく知りたい方は、『回帰分析とは?基礎知識やできること【10分でできる手順付き】』の記事をご参照ください。
例2. 商品の売上と関係のある項目を見つけられる
商品の売上と関係のある項目や要因を見つけることも、ビジネスにおいてとても重要になります。
なぜなら、売上にどのような要因が関係しているのかを把握できなければ、売上の改善が行えないためです。
売上と関係がありそうな要因は多くありますが、例えば、以下のようなものが挙げられます。
- 商品の価格
- 顧客数
- 販売地域
- 経済状況
- 季節性
以上のようなデータ項目を詳細に分析することで、それぞれの項目が商品の売上とどのような関係性があるかを把握できるのです。
例えば、商品の価格と売上は強く関係している可能性が高く、商品によっては季節性も大きく関係してくるでしょう。
売上との関係性を把握できることで、売上を上げるための次のアクションが取れるようになります。
例3. 顧客を属性で分類する
統計学を活用することで、自社の顧客をより細かく分類することも可能です。
年齢や性別、居住地などの顧客の属性データを分析してグループに分類することで、それぞれの属性に合ったマーケティング施策を打ちやすくなります。
例えば、顧客の分類に使われるデータは以下のようなものです。
- 年齢、性別、職業、年収などの基本的な属性データ
- 過去の購買履歴や購買金額などの行動データ
このようなデータからそれぞれの顧客をグループに分けることで、似たような特徴を持つ顧客グループを見つけ出せるのです。
例えば、優良顧客のグループを見つけ出せたら、さらに販促をかけてLTV(顧客生涯価値)を高められます。
また、広告を打ち出すときにも効果がありそうな顧客だけに広告を打てるようになるため、無駄な販促費用をかけずに済むのです。
顧客を属性に分類できるだけで、売上の向上にもコストの削減にも繋がるので、できる限りビジネスに活用するようにしましょう。
統計学と機械学習の違い
このように、統計学は物事を論理的に判断するのに役立ちますが、同じくデータを元に物事を判断する時に役に立つものとして機械学習があります。
統計学と機械学習は、データを用いることや、使用する場面がにていることから似たようなものだと考える人もいますが、実際は大きな違いがあり、それぞれ得意なことも違います。
統計学と機械学習の違いとは、何を調べるため分析を行うのかという目的の部分です。
統計学では、既に存在しているデータにどのような意味や傾向があるのかを知ることができます。
データはただ用意しただけでは多くの場合役に立ちません。
統計学を用いてそのデータが持つ特徴や性質を調べることで、初めて意味のある資料として扱うことができます。
統計学を用いて予測を行う場合は、データの性質を知ることできるため、予測の妥当性やどんな条件が貢献するかということを踏まえた判断ができます。
統計学ができること:データが持つ特徴や性質を説明すること
統計学が得意なこと:どんな条件が貢献するか等の要因を踏まえた予測
一方で、機械学習では分析したいデータを学習モデルに与えることで、今後はどのようになっていくのかという未来予測をしています。
この時、学習モデルは与えられたデータを用いて勝手に学習を行ってパターンや条件を見つけ、そこから導き出した結論のみを提示します。
そのため、とにかく精度の高い予測をしたい場合には機械学習が適しています。
しかしその反面、なぜその結果が導かれたのかという部分は人間には分かりません。
機械学習ができること:データが今後どのようになっていくのか予測すること
機械学習が得意なこと:精度の高い予測
このように、一見似たようなイメージがある統計学と機械学習には、データを用いて何をしたいのかという目的の部分に大きな違いがあります。
自分が知りたいのはどちらの手法で導き出せる結論なのかを適切に判断するのは非常に重要です。
まとめ
統計学はデータを数値やグラフで表して、物事を論理的に説明するための学問になります。
統計学を活用できると、データの傾向やパターンを明確に把握できますし、表やグラフで人にもデータを分かりやすく説明できるのです。
統計学でできることは以下の5つです。
- データの特徴を数値化して把握できる
- データの特徴や傾向をグラフや図で見えるか化できる
- データから近い未来を予測できる
- データ同士の関係性を把握できる
- データを分類できる
以上のようなことができるため、統計学は多くの分野の分析や意思決定に不可欠なものとなっているのです。
統計学は様々なことができるため、以下の場面で活用されています。
- 新商品の需要予測をする
- 商品の売上と関係のある項目を見つけられる
- 顧客を属性で分類する
以上の活用例からもわかるように、統計学はビジネスのあらゆる場面で活用されています。
なので、統計学を用いることで、データから多くの課題の対処を行え、戦略的な意思決定を行えるようになるのです。
もし、「データはあるけど、効果的な活用ができていない…」「そもそも、どんなデータが使えるのか分からない…」とお悩みであれば、『かっこのデータサイエンス』にご相談ください。
課題点のヒアリングからサンプルデータの分析まで、今だけ無料で承っております。
詳細は以下のページでご確認ください。