「データサイエンティストの仕事内容は?」
「データサイエンティストにはどんなスキルが必要?」
と気になりませんか。
データサイエンティストとは、統計やAIの知識を用いてデータ分析を行い、そこから得た知見を元に企業の課題解決を支援する人材のことです。
ビジネスシーンを例にすると、データサイエンティストは商品Aが誰に購入されやすいかなどを見つけ、これを元に適切な層に商品をリコメンドするような施策の立案をします。
このようなことをするデータサイエンティストについて、この記事では以下を解説していきます。
- データサイエンティストの定義
- データサイエンティストの仕事内容
- データサイエンティストに必要なスキル
この記事を一読することで、データサイエンスの分野に興味を持っている方が、キャリアを選択する際に役立つ情報を得ることができるでしょう。
\経験豊富なかっこのデータサイエンティストがまとめました!/
目次
データサイエンティストとは?
データサイエンティストとは、冒頭でもお伝えしたように統計やAIの知識を用いてデータ分析を行い、そこから得た知見を元に企業の課題解決を支援する人材です。
また、データサイエンスを行っている(データを使って分析する)人が「データサイエンティスト」と呼ばれることが多いです。
ではそもそも「データサイエンティスト」の定義や求められる能力はなんなのか、「データアナリスト」との違いなどについて、この章では解説していきます。
- データサイエンティストの定義と求められる力
- そもそもデータサイエンスとは
- データサイエンティストの需要
- データサイエンティストは育てられる?
データサイエンティストの定義と求められる3つの力
データサイエンティスト協会では次のように定義しています。
「データサイエンティスト(分析人材)とは、高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作ることができる者をいう。」
つまりデータサインティストは、顧客のビジネス課題を抽出し、その解決に向けて、適切にデータを収集・処理・分析をします。
そして分析結果から有益な情報を発見し、顧客のネクストアクションを支援します。
よって、データサイエンティストには大きく分けて3つの力が求められます。
- 顧客のビジネス課題を理解し解決に導く力
- 統計学やAIを駆使しデータ分析を行う力
- データの収集や加工など適切にデータを扱う力
データサイエンティストを目指すためには、まずこの3つの力を養っていかなければいけません。
そもそもデータサイエンスとは
データサイエンスとは、蓄積されたデータを使って問題を解決するために必要な情報を発見する学問のことです。
統計学やデータマイニング、機械学習、予測分析などの技術を用いて、今まで分からなかった情報を見つけ出せます。
例えば企業(ビジネスシーン)でのデータサイエンスの活用は、以下のような流れで行われます。
上図の流れは「PPDACサイクル」と呼ばれ、一般的にデータ分析の流れとして知られています。
より詳しく「データサイエンス」という言葉を知りたい方は以下の記事でまとめているので参考にしてみてください。
データサイエンティストの需要
多くの企業がデータ活用に取り組む流れであるのに対し、データサイエンティストは不足しています。
データサイエンティスト協会による、「データサイエンティストの採用に関するアンケート」では、6割以上の企業が目標に対して人材確保ができなかったと回答しています。
※引用:データサイエンティスト協会
また経済産業省の独立行政法人情報処理推進機構のアンケートでは、DXを推進する人材が量と質ともに8割以上の企業が不足していると回答しています。
- 「量」に関するアンケート
- 「質」に関するアンケート
これらのグラフからわかるように、多くの企業がDX人材を欲しいと思いながらも、確保に苦労している状況です。
企業でデータサイエンティストは育てられる?
企業でデータサイエンティストを育てるのは非常に困難だと言えるでしょう。
なぜならデータサイエンティスト経験のある人材が少なく、教えられる人がいないからです。またデータサイエンティストに必要な知識は幅広く、学習量も多いため、一通りの知識やスキルの習得には時間がかかります。
さらに、ビジネス課題を正しく理解し、適切な分析手法で価値あるアウトプットを出すまでの道筋を立てられるようになるには、経験が必要となります。
かっこ株式会社ではデータサイエンス人材を育成できる
なお、当サイトを運営するかっこ株式会社では顧客とデータサイエンスの取り組みをしていく中で、顧客が自走できるようにデータサイエンス人材を育成していく、というビジョンを持っています。
文具メーカーである株式会社デザインフィル様との取り組みでは、実際にデザインフィル様の中にデータサイエンス部門が発足しました。
今では営業部門や企画部門を横断してデータによる課題解決や価値創出を提案、実行する業務を行っています。
データサイエンティストの仕事のすべて
ここからはデータサイエンティストの仕事内容について詳しく説明していきます。
データサイエンティストの仕事は主に以下のようなことを行います。
- ビジネス課題の抽出
- 分析方針の策定と提案
- データ収集
- データの前処理
- 基礎集計
- データ分析
- レポートの作成と分析結果の報告
- システム開発・運用
ただデータ分析をすれば良いということではなく、次のプロセスを踏んでいく必要があります。
ビジネス課題の抽出
まずは顧客からヒアリングを行い、ビジネス課題を抽出します。
データ分析において最も大切なのは目的の設定です。
顧客が何に対して、どのような問題を抱えているのか、どうして問題となっているのかを聞き取り、データ分析によって解決したい課題や目的を理解します。
なお顧客自身も本来の課題を理解していないケースがあるため、目的の背景や理由まできちんと把握する必要があります。
分析方針の策定と提案
ヒアリングで課題が明らかになったら、それを解決するための分析方針を立てます。
課題に対して適切な統計的手法や機械学習の手法を検討し、どのようなアプローチで取り組んでいくのか計画を立て、顧客に提案します。
提案では多くの場合、経営者を相手にします。経営者に対して、データサイエンスを用いてこのように取り組めば、このような結果が見込める、ということを簡潔かつ論理的にプレゼンテーションします。
データ収集
顧客がすでにデータを蓄積している場合はデータを受領するのみですが、外部データを用いる場合はデータ収集が必要です。
他にも顧客に対して収集するデータの内容や集積方法など、設計からアドバイスをすることもあります。
設計では、目的や分析方針を元に、どのようなデータがあれば達成できるのかを検討します。
データの前処理
データが集まってもすぐに分析できるとは限らないので、分析しやすい形にするためにデータの前処理をする必要があります。
例えば、
- 欠損値や外れ値
→除去または補完 - 本来数値を入力する項目に「計測不可」の文字が入っている
→データを除去 - 会社名が「(株)」と「株式会社」のように統一されていない表記
→名寄せの処理
などを行います。
このように地味な作業ですが、データ分析は前処理が8割と言われるほど重要度の高い工程です。
基礎集計
データを整形したら、分析を行う前に基礎集計を実施します。
基礎集計とは、データを様々な切り口で集計し、基本統計量や分布から現状の把握をすることです。
例えば以下のような集計をします。
- 月ごとの購買件数の推移
- 商品を購入した人の男女比
- ユーザーの平均購入金額
- ユーザーの平均購入間隔
データという客観的な事実に基づいて正しく現状把握することで、個人の思い込みによらない仮説立てや有効な施策の立案が期待できます。
データ分析
現状把握ができたら次はいよいよデータ分析です。
統計的手法や機械学習を用いて分析を行います。
実際に行うデータ分析の手法は以下のようなものがあります。
分析手法 | 解説 | 参考記事 |
バスケット分液 | 商品の併売分析に用いられる手法。普通では気づけないような商品の併売候補を見つけられ、商品の併売戦略に繋げられる。 | 『バスケット分析とは?商品分析の例やエクセルでのやり方を解説』 |
クラスタリング | 似た特徴を持つデータをまとめ、複数のグループに分ける手法。ビッグデータを人間が理解できる特徴に分類し、判断や、意思決定を助ける。 | 『マーケティングから不正検知まで、データの理解と意思決定を助けてくれる「クラスタリング」とは?』 |
決定木分析 | 分類や値の予測を行う手法。判断結果に到るまでに辿った条件分岐を出力するため、結果は論理的に説明がつく。 | 『決定木でデータドリブンに、ビジネスを成功させる判断基準を作ろう』 |
ロジスティック回帰分析 | 2値の分類を行い、分類の中で重要な変数について抽出する手法。分類に影響を与えた変数を見つけ出すことでサービスなどの改善点や重要視すべき点を判断できる。 | 『ロジスティック回帰分析とは?使える場面や実装まで徹底解説!』 |
データ分析をすることで、経営課題に対してデータに基づいた具体的なアクションが可能となります。
レポートの作成と分析結果の報告
データ分析を行ったら、レポートの作成と結果の報告を行います。
報告の相手は経営者や事業部門長であることも多く、データ分析に関する知識を持っていない場合があります。
そのような相手に対してもわかりやすく可視化したレポートを使って、論理的に説明することが求められます。
システム開発・運用
分析結果が有用であることがわかれば、それを元にシステム・サービスの開発まで行うことがあります。
例えば弊社では、コールセンターの呼量を予測し、それを元にスタッフのシフト表を自動生成するサービスを提供しています。
システム開発には、ネットワークやサーバーの知識、プログラミングスキルも必要になります。
データサイエンティストに必要な3つの力
データサイエンティストの業務についてお伝えしてきましたが、ここからはデータサイエンティストに必要な力を紹介していきます。
データサイエンティスト協会では、必要なスキルセットとして3つの力を定義しています。
- ビジネス力
- データサイエンス力
- データエンジニアリング力
以下でそれぞれ詳しく解説していきます。
ビジネス力
ビジネス力とは「課題背景を理解した上でビジネス課題を整理し、解決する力」です。
例えば以下のような能力が求められます。
- 顧客の業務やビジネス課題を理解する力
- 解くべき課題の構造を整理し、論点を見極める力
- データ分析のプロジェクトを企画し、論理的にプレゼンテーションする力
- 分析結果の意味を正しく理解し、言語化する力
- データから得られた示唆がビジネス的な価値であるかを判断する力
このようにビジネス力では、顧客のビジネス課題を理解し解決に導くことが求められます。
データサイエンス力
データサイエンス力とは「情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力」です。
例えば以下のような能力が求められます。
- 目的の達成に必要なデータを理解し、取得したデータで達成可能かを判断する力
- 外れ値や欠損値の処理など、データクレンジングを行う力
- 目的に対して適切な手法で集計や分析を行う力
- pythonやRなどのプログラミングスキル
- モデルの選択、パラメータの設定など適切にモデルを構築する力
このようにデータエンジニアリング力では、データの収集や加工など適切にデータを扱う力が求められます。
データエンジニアリング力
データエンジニアリング力とは「データサイエンスを意味ある形に使えるように実装、運用できるようにする力」です。
例えば以下のような能力が求められます。
- 目的を達成するためのデータ内容や取得方法を提案する力
- 分析環境を構築する力
- テーブル設計を行う力
- データベースの知識、データの取得やSQLでの集計などデータを扱う力
- ITセキュリティの知識
このようにデータエンジニアリング力では、データの収集や加工など適切にデータを扱う力が求められます。
データサイエンティストになるためのスキルの習得方法3つ
前述したように、データサイエンティストには専門的な知識からビジネススキルまで多種多様なスキルが求められます。
これらを習得するには、主に3つの方法があります。
- 講座を受講する
- 資格を取得する
- インターンシップに参加する
それぞれ以下で詳しく解説していきます。
講座を受講する
まずはデータサイエンティストの育成講座を受講することが挙げられます。データサイエンティストに必要な知識は幅広く、学習量も多いため、独学では時間がかかります。
そのため人材教育会社が提供するデータサイエンティストの育成プログラムを受講することも選択肢の一つです。
また総務省統計局は無料のオンライン講座を公開しているので、まずはここから初めてみるのも良いでしょう。
資格を取得する
データサイエンティストになるために必須の資格はありません。
しかし、学習により知識を習得できるほか、資格があることで自身のスキルを客観的に証明でき、就職活動で有利になります。
代表的なデータサイエンス関連の資格は主に8つあります。
- 応用情報技術者試験
- 統計検定
- アクチュアリー試験
- データサイエンティスト検定
- OSS-DB技術者認定試験
- データベーススペシャリスト試験
- G検定・E資格
- Python 3 エンジニア認定基礎試験
応用情報技術者試験や統計検定は難易度が比較的優しいので、挑戦しやすいでしょう。
インターンシップに参加する
顧客の課題を理解したり、分析結果をわかりやすく説明するような「ビジネス力」は、経験の中で培われる力でしょう。
実際にデータサイエンスがどのようにビジネスで使われていて、どのような価値を生み出しているかを学ぶには、企業のインターンシップに参加することが効果的です。
かっこ株式会社では積極的にインターン生を採用しており、卒業生は200名にものぼります。
インターンシップが学生にどのような経験を提供できたのかについては、インタビュー記事をご覧ください。
【インタビュー】新卒データサイエンティストに話を聞いてみた
かっこのインターン経験を経て、新卒で正社員として入社した高田さんにインタビューし、「データサイエンティスト」のお仕事についてリアルな声を聞いてきました。
Q1. どんなプロジェクトをやっている?
インターン時代には文具メーカーである株式会社デザインフィル様の案件で、利益を最大化するように各文房具の生産量を最適化するプロジェクトに参加しました。
例えば、カレンダーなどの商品が売れる時期は決まっていて、時期をすぎると売れなくなってしまいます。
※実際のデータ分析(データサイエンス)活用事例インタビューはこちら
大量に余ったり、かといって欠品も起きないように、商品の適切な生産量はどれくらいかというのを決めるためにデータ分析を行いました。
また生産量を管理するシステムの開発にも携わっています。
現在は、大手モバイルキャリアの案件で、LINE公式アカウントを顧客との接点として様々な施策を行い、どのようにしたら利益を上げられるのかを検討する分析を行っています。
Q2. (データサイエンティストとしての)大変なところは?
データ分析の知識以外にも、多岐にわたる知識が必要なところです。例えば、顧客や課題を深く理解するための業界・事業についての知識(ドメイン知識)や、GitやDockerなど開発を行うためのツールも扱えるようになっておく必要があります。
様々なプロジェクトに参加することで、あらゆる知識の習得に励んでいます。
またプロジェクトの管理者として、顧客やメンバーとの円滑なコミュニケーションも求められます。
顧客に対して、定期的なプロジェクトの進捗報告や、問題が発生した場合の報告など透明性のあるコミュニケーションを心がけています。
また、メンバーとの適切な情報共有や意見交換の場を設けることで、スムーズなプロジェクトの進行を行っています。
まとめ
以上、「データサイエンティスト」について、どんな人のことを指すのか、定義、仕事内容や必要なスキルについて解説してきました。
データサイエンティストの仕事は主に、
- ビジネス課題の抽出
- 分析方針の策定と提案
- データ収集
- データの前処理
- 基礎集計
- データ分析
- レポートの作成と分析結果の報告
- システム開発・運用
です。
また、必要な能力は
- 顧客のビジネス課題を理解し解決に導くビジネス力
- 統計学やAIを駆使しデータ分析を行うデータサイエンス力
- データの収集や加工など適切にデータを扱うデータエンジニアリング力
の3つです。
データサイエンティストの仕事内容は幅広く、求められる知識や能力も多岐に渡ります。
かっこのインターンは経験がなくても、熱意や積極的に学ぶ意欲があれば応募できます。
データサイエンスの分野に興味がある方、実務経験を積んでみたい方は、ぜひ応募してみてください。
また、自社内のデータサイエンス人材の育成にお困りの企業様も、ぜひ『かっこのデータサイエンス』にご相談ください。