こんにちは!30代で転職し、現在はデータサイエンティストとして充実した毎日を過ごすYujiです。
データサイエンティストは、企業のビッグデータを分析し、ビジネス戦略の決定に役立てることができる重要なポジションです。
そんなデータサイエンティストとしてのキャリアを積み上げるには、適切なスキルと知識が必要となります。
今回は、データサイエンティストとして転職するために必要なスキルとその習得方法について解説します。
データサイエンティストに必要なスキル
データサイエンティストに必要なスキルは多岐にわたります。
正直、関わるプロジェクトや仕事内容によって、必要なスキルに違いが出るとは思うのですが・・・。
転職するために必要な、そして成功するために必須なスキルを具体的に紹介したいと思います。
今回ご紹介するのは、こちら。
- プログラミングスキル
- 統計学と数学知識
- 機械学習知識
- コミュニケーションスキル
必要だと思う理由や、具体的な習得法なども紹介していきますね。
1. プログラミングスキル
データサイエンティストにとって、プログラミングスキルは必須です。
データの前処理や分析、可視化を行うためにも、知っていて当たり前、といったレベルです。
データ分析でよく用いられるプログラミング言語は基本的な文法をマスターしている必要があります。
例えば、
- SQL
- Python
- R
などは必須言語です(PythonとRはどちらかを習得できていれば良いです)。
また、上記に挙げたプログラミング言語に加えて、データ分析に用いる様々なライブラリのスキルも習得する必要があります。
例えばPythonだと、
- Pandas
- PyTorch
- scikit-learn
- statsmodels
などが挙げられます。
これらのプログラミング言語とライブラリを駆使して、行いたい処理を短い時間で正確にコードに起こし、実現することが求められます。
プログラミングスキルの習得方法は?
基本的には、書籍やWEBサイトを活用することで習得可能です。
人によって違うとは思いますが、僕は書籍とWEBを半々くらいで活用しながら覚えていきました。
また、転職するにあたっては、ただ知識を身につけるだけでなく、利用経験が必要となります。
ただし、それは会社で実務として扱っていた経験だけでなく、例えばデータ分析コンペなどで使った経験でもOKです。
要は、実際に動かして何かしらの分析をした経験、実績があれば良いということです。
僕が実際に使ってよかったな、と思う書籍も紹介しておきます。
データを扱う人すべてにおすすめなのが、こちら。
初心者にも使えて、SQL、Python、Rが網羅されているので、手元にあると便利かも。
予測モデル、機械学習をしたい人向けには、こちら。
初心者というよりは、少し勉強して、これから中級以上を目指す人にはもってこいな本でした。
最後に、手を動かす練習問題的な本をご紹介。
結局、やってみないと身につかないので。
こういった、練習問題でどんどん使う練習をすると実践でも役立つと思います。
2. 統計学と数学の知識
データサイエンティストには、統計学や数学の知識が必要です。
例えば、分散や標準偏差、回帰分析や仮説検定など、統計学の基礎的な知識だけでなく、微積分や線形代数などの数学の知識も求められます。
なぜ統計学や数学の知識が必要かというと、データサイエンティストはデータを「見る」仕事だからです。
データの持つ意味を想像する力=統計学や数学の知識です。
分析して出てきた数字が、どうやってでてきたのか?を理解していないと、そこから色んなインサイトが得られません。
例えば、データを集計してコンバージョン10%と出たとします。
それがどんな意味を持つのか?を考えるには、統計学や数学の知識が必要になります。
100人のうち10人が購入した10%という数字と、10万人のうち1万人が購入した10%では意味が全然違います。
数字が計算された過程を考えて「10%」から色んな示唆を得るのがデータサイエンティストの仕事なので、数字に鈍感だと仕事になりません。
統計学や数学知識の習得方法は?
学生時代に学ぶ機会があった人はそれでOKですが、今から学ぶという場合には、オンライン学習サイトがおすすめです。
例えば、オンラインPython学習サービス「PyQ™(パイキュー)」は統計を素早く身につけて実装できるようにするにはおすすめです。
Pythonに特化したサービスではありますが、定額制ですべての講座を受講できるのが魅力です。
他にも、スタアカ(スタビジアカデミー)などは、データサイエンスを網羅的に学ぶのにも使えます。
「統計学概要コース」が用意されているので、まずはそこからスタートでもいいかもしれないです。
独学コースであれば月額も安いので、入門で一度見てみるのはありです。
SQLとPythonを組み合わせて実データを使った様々なワークを行えるので、より実務に即した勉強ができそうです。
また、「統計学の時間」というWEBサイトはかなりおすすめです。
統計学の基礎から応用までが丁寧に解説されていて、大学で学ぶ基礎レベルから学べます。
具体例もたくさん掲載されていて、練習問題も充実しているので、自分で学習するにはもってこいなサイトです。
3. 機械学習の知識
機械学習は、データサイエンスの中でも重要な分野です。
機械学習によって、データの予測や分類を行い、ビジネス上の問題を解決することができるという点で、重要な知識です。
とはいえ、自分がデータサイエンティストとして何をしたいかによって、このスキルを磨く必要があるかどうかは変わってきます。
具体的に、自分が目指す姿に、どんなレベルのスキルが必要とされているかを調べるには、転職先の「ジョブ・ディスクリプション」を見ればOKです。
ジョブ・ディスクリプションとは、職務内容や責任範囲、必要スキル、求める成果などを定義した書類です。
この「必要スキル」項目をチェックすれば、自分に足りていないスキルが何なのか、具体的に知ることができます。
機械学習の知識の習得方法は?
基本的に書籍で学ぶことができます。
僕がおすすめするのは、
などです。
また、プログラミングスキルの習得部分でもおすすめした、
は、機械学習を学ぶ上でも役立つ本だと思います。
4. コミュニケーションスキル
データサイエンティストは、ビジネス部門や開発部門と密に連携して業務を進めることが多いため、コミュニケーションスキルが必要です。
仕事内容としても、データ分析結果を分かりやすく報告し、ビジネス戦略の決定に貢献することが求められるので、意外とおろそかにできません。
また、要望を理解し、ビジネス上の問題を解決するための提案を行うことも重要なため、コミュニケーションスキルは結構重要です。
コミュニケーションスキルの習得方法は?
とはいえ、うまくしゃべるとか、楽しい会話ができるとか、そういったコミュニケーションスキルとは別物です。
データサイエンティストが必要とするコミュニケーションスキルは、実務で学ぶのがマストです。
とはいえいきなりは難しいので、本を読むとするなら、コンサル系の書籍を参考にするといいと思います。
例えば、おすすめな本としては
などは入門としてけっこういいと思います。
さらに、このシリーズもおすすめです。
意思決定者に向けて、何を伝えなくてはいけないか、がコンパクトに書かれている良書でした。
さいごに
データサイエンティストとしての転職活動は、自己学習やスキルアップに取り組むことが欠かせません。
データサイエンスの技術は常に進化しており、新しい技術やトレンドが続々と生まれているので、転職後も勉強が続きます。
市場価値の高いデータサイエンティストとしてのキャリアを築くためには、日々の学習や継続的なスキルアップは避けて通れない道なのかもしれません。
仕事をしながら新しいことを学ぶのは大変ではありますが、ぜひ、自分自身のキャリアをアップデートし、市場価値の高いデータサイエンティストとしてのポジションを確立していきましょう。