本書は世界各国で出版・公開された書籍 "Approaching (Almost) Any Machine Learning Problem" の翻訳書です。豊富なコード例と機械学習にまつわる基礎的な内容を取り上げていきます。
交差検証や特徴量エンジニアリングなどモデル作成以前の重要な要素にも紙面が割かれ、コードの再現性やモデルのデプロイといった話題にも踏み込みます。 モデル作成では、表形式のデータセットだけでなく、画像認識や自然言語処理に関する内容が具体的な実装と共に示されます。
本書の節々から、性能を追求するだけではなく実運用にも重きを置いた著者の姿勢が垣間見えるでしょう。
"KaggleのGrandmasterが書いた本"と聞くと高尚な話題が展開される印象を受ける方もいるかもしれませんが、実態は実践的なプログラミング解説書です。Kaggleコミュニティに限らず機械学習に興味を持つ多くの方に手に取っていただきたいと考えています。
この本ではコードが非常に重要です。何が起こっているのかを理解したければ、コードを注意深く見て、"自分で" 実装しなければなりません。
If you didn't code you didn't learn.(コードを書かねば、何も学べない。)
ぜひ自らの手でコードを実装し、学びを深めてください。
第0章 実行環境の準備
第1章 教師あり学習と教師なし学習
第2章 交差検証
第3章 評価指標
第4章 機械学習プロジェクトの構築
第5章 質的変数へのアプローチ
第6章 特徴量エンジニアリング
第7章 特徴量選択
第8章 ハイパーパラメータの最適化
第9章 画像分類・セグメンテーションへのアプローチ
第10章 テキストの分類・回帰へのアプローチ
第11章 アンサンブルとスタッキングへのアプローチ
第12章 コードの再現性やモデルのデプロイへのアプローチ