私はプログラミング未経験から独学でPythonを勉強し、Kaggle Masterになり、今ではデータサイエンティストとして働いています。
・大学院卒(工学)
・新卒入社時はメーカー勤務(設計)
・元々のプログラミング経験なし
・独学でPythonを勉強
・現職はデータサイエンティスト
プログラミング未経験からデータサイエンティストになるために重要なことは、実績を作ることです。
結論、Kaggleもしくは国内プラットフォームのコンペに出て、実績を作るしかありません。
理由は以下のとおり。
・本業では実績を作れないから
・活きたデータを扱えるから
・実績を出しにくいから
本業では実績を作れないから
プログラミング未経験の人であれば、おそらく本業は全く別の職種でしょう。
そのためPythonを勉強したところで実績を作る機会が得られず、実績がないから転職もできないという、無限ループに入っているはずです。
Kaggleであれば、本業など関係なく誰でも参加できますし、誰でも実績を作るチャンスがあります。
というか、コンペ以外で実績を作ることはほとんど不可能であると思います。
活きたデータを扱えるから
Kaggleでは、企業または研究機関が実際に困っていることを解決するためにデータを提供し、コンペを開催しています。
つまり、コンペで機械学習モデルを作ったということは、現実世界での困っている企業や組織に解決策を提案できていることになります。
一方で書籍やブログで使用されるデータは、残念ながら、初学者でも簡単にモデルが組めるように非常に優しいデータとなっていることが多いです。
なので、誰でも簡単に扱えて、簡単にモデルが組めるデータで実績をアピールすることになり、圧倒的に説得力が弱くなってしまいます。
実績を出しにくいから
Kaggleでの実績(メダル)獲得は非常に難しく、ほとんどの参加者が諦めることになります。
しかし、簡単に達成できないからこそ、達成すれば説得力のある実績となるのではないでしょうか。
もちろん資格であっても、合否がある以上、取得者のレベルを評価できる指標だと思います。
しかし先述のとおり、コンペになる課題は現実世界でも解決したい問題であり、その中で一定の評価を得られたという実績のほうが、はるかに説得力があると私は思います。
なのでやはり、未経験からデータサイエンティストを目指すなら、説得力のある実績を得るためにも、さっさとKaggleに登録してコンペに出てみることをおすすめします。
まとめ
今回はあくまで私の偏見もあるので、一般的な意見とは違っているかもしれません。
しかし、データサイエンティストのキャリア採用をしている企業の募集要項を読むと、「Kaggle等のコンペティションでの実績」が推奨要件に入っていることがよくあります。なので、本気でデータサイエンティストになりたいのなら、コンペへの参加は避けられない道だと思います。
注意点としては、Kaggleではたまに、ラッキーパンチでメダルを獲れてしまうことがあります。その場合、無理矢理実績としてアピールしないように気をつけましょう。
あくまで企業が見ているのはその人のスキルです。当たり前ですが、「ラッキーでメダル獲れました!」と言っても何も説得力がありません。
Kaggleに登録したけど何したらいいかわからんって人は、”Playground Series”をやってみると良いです。
メダルは貰えませんが勉強にはなりますし、ガチコンペに参加する準備運動になります。
コメント