「データ分析の手法には何がある?」
「どの手法をどんな時に使用するべき?」
とお悩みではありませんか?
データ分析は適切な情報を取捨選択するために必要不可欠なスキルです。
近年は『ビッグデータ』や『人工知能』などのバズワードが有名になっており、データ分析の重要性を世間が少しずつ認知してきています。
データ分析には多くの手法が存在しますが、解決したい課題に合致した分析手法を見つけることは難しいです。
そこで本記事では、
- 現場でよく使われる分析手法7選
- データ分析が活躍した事例
- データ分析におすすめのツール
などについて解説していきますので、ぜひ参考にしてください。
目次
現場でよく使われるデータ分析手法7選
世界には様々な分析手法が存在するのですが、今回は「現場でよく使われる手法」を例と共に紹介します。
以下が現場でよく使われるデータ分析手法です。
- 時系列分析
- 回帰分析
- 相関分析
- 主成分分析
- クラスター分析
- 決定木分析
- 数理最適化
それぞれ解説していきます。
時系列分析
時系列分析とは、ある現象の時間変動を捉えるために時系列データを分析する方法のことです。
例えば、来年の1月10日における東京都港区の天気を予測したい時、過去の気象データを参考にして予測を立てる方法が一般的です。この時、過去のデータから1月10日は高い確率で晴れるという事が分かりました。
このことから、来年の1月10日も晴れるであろうと考えることができます。
このような分析をすることが「時系列分析」といいます。
「時系列分析」は、ビジネスの現場で売上や来客数の変動を分析する際に用いられることがあります。
この場合の時系列データの例は、
- 株価データ
- 気温や降水量などの気象データ
- 人口統計データ
などを用います。
「時系列分析」は、測値や予測の根拠を知りたい時などに有効な分析手法です。
回帰分析
回帰分析とは、分析対象のデータと他のデータ間の関連性を求める分析手法のことです。
回帰分析において、単回帰分析と重回帰分析の2つがあります。
単回帰分析では、以下のような項目の組み合わせの分析を行うことができます。
- 例1:売上と広告費の関係
- 例2:アイスクリームの売上と気温
- 例3:試験の成績と学習時間 etc.
一方、重回帰分析では以下のような組み合わせの分析を行うことができます。
- 例1:タイタニック号の生存結果に対する、性別、年齢、運賃、船室、チケットナンバー、乗船した港などの変数との関係
- 例2:売上に対する、広告費、販売員数などの変数との関係 etc.
このように、回帰分析は変数と変数の関係性を捉える際に有効なデータ分析手法だという事が分かります。
回帰分析についてもっと知りたいという方は『回帰分析とは?基礎知識やできること【10分でできる手順付き】』こちらの記事を読んでみてください。
相関分析
相関分析は、複数のデータの関連性を分析する手法で、ここでは、代表的な2種類のデータの関連性を分析する例を紹介します。
以下のグラフを見てください。このグラフの縦軸と横軸はそれぞれ、食糧費と都道府県別の総人口となっています。
※引用:「総務省統計局」
このグラフのケースでは「相関係数値が0.4364」で、若干の右肩上がりの線形が表示されています。
この相関分析によって、都道府県別総人口と家庭の食糧費の傾向を読み解くことができるようになりました。
他にも、以下のような変数間の関係を分析する際にも活用されています。
- スーパにおける天気と来客数の関係
- 年齢と血圧の関係
- 残業時間と営業成績の関係 etc.
しかし、相関分析を扱う上で注意しなければならない点もあります。
そちらについては『2種のデータの関係性を明らかにする「相関」のおはなし』の記事で紹介しているので、気になる方は読んでみてください。
主成分分析
主成分分析とは、たくさんの量的な説明変数を、より少ない指標や合成変数(複数の変数を合体させたもの)に要約する手法のことです。
例えば、身体情報として身長と体重のデータがあるとします。主成分分析の目的は、この複数の特徴量から新たな特徴量を作り出し、元の特徴量よりも少ない変数でデータを説明することです。
今回の例では、身長と体重から肥満度を示すBMIという主成分を求めることができます。
これが分かれば、現在何が良い・悪い、何を改善すべきかを理解できて、何をすればいいかを知ることができます。
クラスター分析
クラスター分析とは、様々なデータから似ているデータ同士をグループ分けする分析手法のことです。
例えば、パン屋さんが「売上を伸ばすためにキャンペーンを打つ」そのためのクラスター分析を行うとします。
顧客ごとの購買データを分析した結果、月曜日は会社に勤める男性が来店する割合が高く、水曜日は近隣の学校に通う生徒が多く来店しているということが分かりました。
この結果から以下のようなキャンペーンが考えられます。
- 月曜日の朝に会員証を提示すると次回の来店時に使える50円引きクーポン配布
- 学生限定!毎週水曜日に友達や恋人と来店すると200円以下のパン無料!
このように、クラスター分析を行うことによって、似た特徴を持つ顧客をグルーピングし顧客特性を理解しキャンペーンを打つことができます。
決定木分析
決定木分析とは、ツリー構造を活用してデータの分類やパターンの抽出を目的とする分析手法のことです。
以下のグラフは「運動が好き」「直近で運動を行った」「サウナが好き」というアンケートを100人に実施した結果から、体系が瘦せ型かどうかの予測を行った例です。
決定木分析では、アンケートの回答をツリー状にすることで結果を見やすくすることもできます。
決定木分析を用いることで、統計学の知識がない方や数学が苦手な人でも、分析結果を簡単に理解することができるのです。
また、決定木分析に関してはこちらの記事でも解説しているので、気になる方はぜひ読んでみてください。
数理最適化
数理最適化とは、複数の種類の複雑な制約条件を全て満たしながら、目的を達成させることが出来る組合せを大量に試算し、成果の最大化を追求する手法のことです。
もう少し分かりやすく説明すると、数理最適化では「特定の条件下で成果を最大化するための方法を求める」という事を行っています。
この「特定の条件下で成果を最大化するための方法を求める」という内容を、おせち作りを例にして紹介します。
おせち作りを行う上で達成したい成果は下記の3つです。
- 最も品数が多く、豪華になる組み合わせを考える
- どういう順序で、どの調理器具を使って何のおかずを作るのが、最も早い組み合わせとなるのか
- いつ、誰に対して、どのおかずを提供するのが、最も余りが少なくなる組み合わせとなるのか
これらを意識する上で、考えられる制約の例は以下の7つです。
- 限られた予算内である
- おせちの”ルール”を守って必須のおかずを揃える
- 2人で作るが、1人は料理初心者のため配慮を行う必要がある
- コンロは2口で魚焼きグリルはなく、フライパンなどの食器は沢山ある
- 調理台のスペースは45×120cm。シンクのスペースは40×60cm
- おかずの消費期限を超えたら食べられない
- 全ての人に対してバランスよくおかずを提供する
このように、制約条件のもとで達成したい成果を最大にする組み合わせを求める事こそが「数理最適化」の得意分野なのです。
次に、ビジネスの現場で数理最適化がどのように活用できるのかを紹介します。
数理最適化が活かせるものとして、よく挙げられるのが以下の例です。
- 在庫管理や輸送のコストを最も少なくするために、どの商品を、どのくらいの量、どの工場で、どの順序で生産するのが望ましいかかという組み合わせを日々自動で計算する。
- 看護師やコールセンター等のスタッフのシフト調整にあたって、法令を遵守したうえで、最低必要人数の担保や、メンバのスキル、希望する休日なども考慮に入れ、最も人件費がかからないシフトを自動作成する。
- 商品を小売店まで届ける運送業において、店舗ごとに定められた入庫日時を守りつつ、入庫に必要な時間や渋滞等加味して、数多くある店舗をどういった順序でめぐるのが最も短時間ですむのか、という日々のトラックごとの巡る順番を自動計算する。
このように、「様々な制約下、最も成果が上がるための組み合わせを考える」場面であれば、現場/経営問わず、調達・生産・物流・販売に至るまで幅広く活用できるのが数理最適化の技術です。
人の経験や勘などの定量的な根拠のない課題を解決・改善したい場合には、数理最適化を用いることも1つの手だと言えるでしょう。
また、数理最適化に関してはこちらの記事でも解説しているので、気になる方はぜひ読んでみてください。
データ分析を活かせる3つのシチュエーション
データ分析を行う上で、分析結果をどのように活用するかは非常に重要です。
仮に、結果から間違った結論を生んでしまえば大きな損失に繋がります。このような事態を防ぐために、ケーススタディを行い、最適な方法を考えることが重要になります。
そこで今回は、データ分析を活用できる3つのシチュエーションを紹介していきます。
①マーケティングで活かす
まず、データ分析をマーケティングに活かした例を紹介します。
今回の例ではクラスター分析を用いて、スポーツジムの退会顧客削減を目的とし、この課題を解決しようと思います。
記事の前半でも解説しましたが、クラスター分析を行うことによって似た特徴を持つ顧客をグルーピングし顧客特性を理解することができます。
これにより、利益を生み出すような(またはLTVが高い)顧客と、そうでない退会顧客の違い(性別やどれくらいの頻度で通っているか、継続期間など)を把握し、今後の施策を打つことが可能となるのです。
マーケティングに関するデータ分析の手法は数多く存在し、今回紹介した例はあくまでその一部となります。
②生産性向上に活かす
次に、データ分析でコールセンターのコスト削減を行った事例を紹介します。
まず、コールセンターの運営コストを削減するためには、現状のオペレーターの対応状況を把握する必要があります。
コスト削減するために行うデータ分析の流れは以下のようになります。
- ①現状のオペレーターの対応状況を把握する
- ②対応状況が悪いところを特定する
- ③効率的なオペレーター配置を計画する
①を実行することで問題点から無駄なコストが発生しているポイントを特定でき、現在のオペレーター対応の改善に繋げることができます。
また、データ分析を活用し②を実行することによって具体的な改善策を導き出すことができます。
具体的には、オペレーターのシフト・受電の対応状況を見ることで以下のような時間帯を特定できます。
- 応答までの時間が長く、人手が足りていない時間帯
- 応答までの時間が常に短く、人手が余る時間帯
そして、③を行うことで無駄な人件費のカットを検討できるのです。
この、③を行う際に先ほど紹介した数理最適化の技術を活用します。
具体的には、以下のような制約を満たして最適な人員配置計画を作成します。
- 経営指標
- 従業員の勤務希望
- 労働条件
実際にこのサイトを運営する「かっこ株式会社」では、上記と類似した案件を行い、年間0.6億円のコスト削減を試算したケースも存在します。
このように、データ分析を用いることでコストの削減を行うことも可能となります。
③カスタマーサクセスに活かす
最後に、データ分析がカスタマーサクセスに活かせることを紹介します。
「かっこ株式会社」では実際に、サブスクリプションサービスを提供する企業に対して、以下のようなカスタマーサクセスの支援を行ってきました。
- 回帰分析を活用した顧客特徴の明確化(どのようなお客様が長期間利用するかなど)
- 退会する恐れのある顧客に対して、継続利用をしたいと思えるような働きかけ
このように、顧客の成功体験を生み出すためにはデータの活用が欠かせません。
カスタマーサクセスを意識する際は、データの活用を意識してはいかがでしょうか。
顧客が満足してサービスを使用することは、企業の売上増加や経営安定につながるため特に重要な取り組みです。
データ分析におすすめのツール2選
あなたがデータ分析をする際に役立つツールは以下の2つです。
- Excel(エクセル)
- Python(パイソン)
データ分析では、大量のデータの前処理や加工・観察などが必要になります。
しかし、それらの全てを人力で行うことは不可能に近いため、ツールを活用してデータ分析を行います。
Excel
Excelとは、全世界で使用されている表計算ソフトのことです。
業務や学業を行う上で、多くの人が1度は使用したことがあると思います。
Excelをデータ分析で使うメリットは以下の通りです。
- 大量のデータを視覚的に分かりやすくする
- 多くのユーザが使用しているため、悩みの解決策が豊富に存在する
売上データを時系列順に表すことや、売上に影響を与えている変数を線形回帰分析によってグラフとして表すことも可能です。
しかし、本格的なデータ分析には適しておらず、データの取得や前処理、細かい分析はPythonに軍配が上がります。
そのため、手軽に基礎的なデータ分析を行いたい方や与えられたデータを簡単なグラフとして表したい方におすすめのツールとなります。
Python
Pythonとはプログラミング言語の1種で、理解しやすく習得しやすいプログラミング言語とも言われています。
Pythonの特徴は以下の通りです。
- 分析や結果を可視化するためのライブラリが豊富
- 統計や機械学習の分野で使用されている
- 複雑な分析手法をライブラリによって簡単に行える
Pythonにはデータ分析を行う上で便利なライブラリが充実しており、序盤に紹介した分析手法も全てPythonで行うことができます。
もはや、データ分析を行う上で必要不可欠なツールで、データ分析を始めたての人でも最終的には、ぜひPythonの使用を検討してみてください。
また、Pythonについてより詳しく知りたいという方は、『Pythonとは?3分で分かる人気の理由と基礎知識』を読んでみてください。
データ分析を勉強する3つの方法
データ分析を適切に行うために身につけなければいけないスキルは多くあります。
そのため、以下の3つの方法で勉強することをおすすめします。
- 書籍で勉強する
- インターネットの情報で勉強する
- オンラインスクールで勉強する
勉強方法のコツとしては、分からないことが発生しても何となく読み進めて全体像を理解することです。
分からないことや難しいことがあっても、何度か読んでいくうちに理解できるようになるので安心してください。
データ分析のおすすめの勉強方法について詳しく解説します。
書籍で勉強する
データ分析を行う時に、求められる知識・スキルは数多く存在します。
そのため、現在の自分に足りていない要素や理想の将来像を意識して書籍を選んでいきましょう。
データ分析関連の書籍は数多くありますが、今回は以下のテーマに沿った書籍を紹介します。
- データ分析の理論
- データ分析の実装
- ビジネス的なデータ分析
ぜひ参考にしてみてください。
①分析者のためのデータ解釈学入門
『分析者のためのデータ解釈学』では、データ分析を行う上で分析者が知っておかなければならない知識が、分かりやすく網羅的に解説されています。
※引用:Amazon
分析が上手くいくかどうかは、分析手法の技術だけでなく、データの質や解釈の方法でも決まります。
当書では、以下のような内容を分かりやすく解説している点が特徴です。
- データのばらつきやバイアスに関する基礎知識
- データを偏らせる行動心理
- 認知バイアスや数理モデリングのポイント
データの本質を捉えるためにも、当書を読んでみてはいかがでしょうか。
②kaggleで磨く機械学習の実践力
『Kaggleで磨く機械学習の実践力』では、コードの実装を行いながら、データ分析の流れや機械学習を交えた分析手法、実務だけでは得られないノウハウを学ぶことができます。
※引用:Amazon
データの前処理や特徴量エンジニアリングなど、コーディングを行う上で意識するべき内容が解説されているため、初学者の方にもおすすめできる1冊となっています。
③マーケティングリサーチとデータ分析の基本
『マーケティングリサーチとデータ分析の基本』では、データ分析やマーケティングリサーチの基本を分かりやすく解説しています。
※引用:Amazon
データとの向き合いかたやデータ分析の基本、分析結果をビジネスに反映させる方法などを解説している点が特徴です。
筆者自身が文系出身のため、初学者に対して易しく解説している点が印象的でした。
数学やデータ分析に抵抗のある方におすすめの1冊です。
インターネットの情報で勉強する
インターネットを活用して学習することも有効な手段です。
現代には多くの学習サイトが存在しており、一昔前と比べてその数は大幅に増加し、優良サイトが数多く存在しています。
データ分析を学習する上で、実際に手を動かしてみることは非常に重要です。
そこで、初学者の方が手軽に学習を行える方法を3つ紹介します。
①目的に合ったWEBサイトを見つける
自分が学びたい内容を学習できるサイトを検索欄から探してください。
冒頭でも述べましたが、現代には多くの学習サイトが存在しています。
下記にデータ分析を行う上で学んだ方が良い項目をいくつかピックアップしています。
- プログラミング
- 統計学
- 数学
インターネットにはこれらを学習できるサイトが数多く存在しています。
例えば、Pythonについて勉強したいと考えているのであれば、検索欄に「Python 学習サイト」などと入力してください。
そうすれば、きっとあなたの条件にマッチしたサイトが出てくるはずです。
海は広いので、理想のサイトと必ず巡り合えるでしょう。
②YouTube
「文章を見続けることが苦手…」
「楽しく勉強したい!」
という方は多いのではないでしょうか?そのような方にはYouTubeがおすすめです。
YouTubeにはデータ分析を行う上で参考になるコンテンツが多く存在しています。
そのため、検索欄に「データ分析」と入力して、興味関心のありそうな動画を再生してみることもおすすめです。
また、自分が興味のあるテーマについて調べてみることもおすすめです。
③Kaggle
※引用:Kaggle公式
Kaggleとは、世界中の機械学習を学ぶ人のためのプラットフォームのことです。
Kaggleに登録することで、誰でも機械学習コンペの参加や学習コースの利用を行うことが可能になります。
このうち、初心者の方はKaggle Learnと呼ばれる初心者向けコースの受講をおすすめします。こちらのコースでは、初歩レベルのプログラミングや機械学習、SQLなどを網羅的に学習できます。
※引用:Kaggle公式
また、既に終了したコンペに取り組んでみるのもおすすめです。
Kaggleでは、過去のコンペに関する議論や他人のコードに関する記録が残っています。
世界で1番有名なデータサイエンスに関するプラットフォームということもあり、コンペの内容を分かりやすく解説してくれているサイトが多い点も魅力的です。
その他にも、以下のようなメリットが存在します。
- 実際の企業のデータを用いて実戦経験を養える
- 自身の客観的な実力を測れる
- 他人の解法を知ることができる点
このように、Kaggleを使用するメリットはたくさんあります。データ分析を行う方は、一度利用してみてはいかがでしょうか。
オンラインスクールで勉強する
最後にオンラインスクールを用いた勉強について紹介します。
オンラインスクールを用いて学習を行うメリットは下記の3つです。
- 時間と場所にとらわれない
- 一流の講師による授業を受けられる
- お金を払うことで退路を断つ
オンラインスクールを活用することによって、受動的かつ能動的に学習を行えるようになります。
また、講師が授業を担当しているため、分からない事や相談したい事がある場合はいつでも頼ることができます。
その他、お金を払っていることにより、意地でも学習しなくてはいけない状況が発生する点も良いところです。
実際、SNS上ではこのような意見もあります。
未経験からIT転職を目指していた過去の自分へ
— ありた|IT・Web転職 (@arita_it_) May 19, 2024
・資格は取らなくていい
・タイピング練習は「e-typing」
・プログラミング学習は丸暗記しなくてOK
・独学は挫折するからスクールいっといたほうがいい
・転職活動も勉強もプロに相談するのが吉
・「お前には無理だよ」の声は無視していい…
3年前フリーランスエンジニアを目指してプログラミングスクールで勉強開始。
— Takuma @ Cloud Infrastructure Engineer (@aws_TakS07) April 20, 2024
30代未経験でエンジニアに転職やプログラミングスクールについてXではネガティブな投稿をたくさん見かけるけど、実際に経験した人からの話だけを信じた方が良いです。簡単ではないけど全く無理ではない。 https://t.co/Q7odbkIJEq
独学では躓くことの多いプログラミングですが、オンラインスクールを活用することによってさらなるスキルアップを見込める場合もあります。
オンラインスクールは数多く存在するため、自分の条件に適したものを検索してみてください。
大事なのはやってみようと思う、その心です。
まとめ
今回の記事では分析手法を軸に、実際の活用事例やツール、勉強法についてを紹介しました。
分析手法と一口に言っても、設定された課題やデータの種類によって、それらを上手に使い分ける必要があります。
そのためには、実際の活用事例を知り、多くのツールを使いこなし、多面的な切り口でデータに対するアプローチを取れるようになる必要があります。
しかし、初めから全てを完璧に行うことは非常に難しいです。
そのため、
「自分にはこんな難しいことできない…」
「専門性が高すぎて取り組めない…」
などと落ち込まないでください。
向上心を持って勉強に励んでいる時点であなたは充分素晴らしいです。
しかし、「データサイエンスを活用したいけど、難しい…」「データサイエンスを自社で活用できるか不安…」とお悩みの方は、『かっこのデータサイエンス』にご相談ください。
あなたのお悩みを解決します。
詳細は以下のバナーをクリックの上、ページをご参照ください。