【Python】機械学習の勉強で読んだおススメの本5冊|Kaggle Expertになるまで

Python
スポンサーリンク

最近、やっとKaggle Expertになれました。

今回は、機械学習を勉強するために私が読んだ本を紹介します。

・機械学習の勉強を始めたい
・何から勉強したらいいかわからない
・Kaggle初心者で右も左もわからない

こんな人向けの記事です。

まず結論から言って、本を読んだところでスキルは上がらないと思っています。

個人的に、本を読んだだけで現状を打破できた試しがないので。

Kaggle Expertになれましたが、たぶん9割は以下の行動が効いたと思います。

①ひたすらコンペに参加した(表画像文章など問わず)
②公開Notebookを理解できるまで読み、写経した
③惨敗しても執念深く続けた

なんとかメダルを取れたのは、平日も土日もPCに向かい続けたからです。

じゃあなんで私が本を買ったのかというと、

本を買うのは、初めに何をしたらいいかわからん状況を乗り越えるため

です。

基礎知識さえ抑えたら、たぶんKaggle内の情報だけで銅メダルは何とかとれます。

お金が惜しいならネット記事で大丈夫です。

レベル感としては、Pythonの文法を含めて、これから機械学習の勉強を始める人向けです。

Pythonではじめる機械学習

機械学習の基礎の基礎の基礎が書かれている本です。

勉強を始めたばかりの初心者ならこの本がいいと思います。

ただ、この本だけを読んでKaggleに挑戦すると浦島太郎状態になり得ます。

紹介している技術が少し古く、最新の高精度のモデルには全く歯が立たないためです。

ランダムフォレストとか勾配ブースティングとかを学べます。

しかしディープラーニングとかは書かれていません。

きなりKaggleに突撃しても意味不明なだけなので、準備運動したい人なら読みましょう。

この本で単純な線形回帰やランダムフォレストなどを学ぶことは、第一歩目としてありです。

Kaggleには”Tabuler Playground Series”という単純なコンペがあるので、この本の内容を試してみるといいかもしれません。

Kaggleで勝つデータ分析の技術

Kaggle全般の基礎知識について書かれている本です。

私の機械学習の知識の9割はKaggleから学んだものです。

なので個人的には、今すぐKaggleに登録してコンペに参加するのが最短の勉強法だと思います。

この本を持っていれば、コンペで何したらいいか程度の情報は抑えられるはずです。

ただし残念ながら本書を読んだだけでは全く勝てません。

銅メダルすら厳しいです。

なぜなら、皆この本の内容を理解した上で工夫しているからです。

むしろ、本書の内容を知っていることがベースラインであるとも言えます。

残念ながら本を読んだだけでメダルを獲ることはできません。

金メダルください。

ゼロから作るDeep Learning

ディープラーニングがどのように作られ、学習されるのかが理解できる本です。

最近のKaggleコンペでの上位モデルは、ほとんどがディープラーニング(ニューラルネット)を使っています。

本ブログでは、初心者向けのモデルとしてXGBoostLightGBMを紹介しています。

しかしこれだけでメダルが獲れるコンペは最近はほとんどありません。

そして、画像や文章、音を扱うモデルにおいてはディープラーニングの知識が必要です。

さらに、Transformerというモデルがほとんどの機械学習タスクで猛威を振るっています。

とどめに、テーブルデータにおいてもTabNetが活躍する始末です。

真剣に機械学習を勉強するなら、もはや避けては通れませんね。

なので、この本でディープラーニングの基礎知識(理論)を抑えましょう。

それから、Kaggleの公開Notebookで勉強すると効率が良いと思います。

ディープラーニングのライブラリとしては、kerasとpytorchが主流です。

どっちが良いとかはなく、両方使えるのがベストです。

どうしても迷うなら、pytorchから始めるといいと思います。

Python実践データ分析100本ノック

この本を読めばデータ加工についての最低限の知識が得られます。

機械学習では、モデル作成だけじゃなくデータ処理(加工)の技術も必要です。

例えばpandasやnumpyですね。

本書で最低限の知識を抑えて、Kaggleで公開されているNotebookの処理を真似てみれば大丈夫です。

費用を抑えたい人は、”Kaggleで勝つデータ分析の技術”だけでも十分かもしれません。

個人的にこの本を最初に読んで前処理を勉強したので、ピックアップしました。

退屈なことはPythonにやらせよう

機械学習とは全く関係がない本です。

なぜ選んだのかと言うと、これまでに紹介した4冊ではPythonの文法についてほぼ触れられていないからです。

つまり、そもそもPythonってどう書くの?ってことがわからないんです。

この本のメリットは本業の事務作業を自動化しながらもPythonの文法を学べることです。

例えばExcel操作をプログラム化できます。

VBAから勉強を始めた私にとってはPythonの入り口としてピッタリの本でした。

事務作業だとアウトプットが見えやすいので、勉強のモチベーションを維持しやすいですよ。

まとめ:インプット1割アウトプット9割

今回は、私が完全無知から機械学習を勉強するために使った本を紹介しました。

9割以上の知識は実戦で学んだので、本の情報は1割程度です。

まず何したらいいの?

っていう状況を解決するためだけに読みましょう。

コメント

タイトルとURLをコピーしました