Pythonによる機械学習モデル構築のための特徴量 抽出・作成実践レシピ
Pythonを活用した70以上の実践的な"レシピ"により表形式データに対する特徴量エンジニアリングのほぼすべてのトピックをカバー。テキストからの特徴量の抽出の付録として日本語モデルでの実例も取り上げます。
Packt Publishing: Python Feature Engineering Cookbook, Second Edition の翻訳書。
1章 欠損値を補完する
2章 カテゴリ変数をエンコーディングする
3章 数値変数を変換する
4章 変数を離散化する
5章 外れ値を扱う
6章 日付と時刻の変数から特徴量を抽出する
7章 特徴量をスケーリングする
8章 新しい特徴量を作成する
9章 Featuretoolsを用いてリレーショナルデータから特徴量を抽出する
10章 tsfreshを使って時系列データから特徴量を作成する
11章 テキスト変数から特徴量を抽出する
付録 日本語を扱う
Soledad Galli : 世界的な学術機関や有名な企業で10年以上の経験を持つデータサイエンティスト、インストラクター、ソフトウェア開発者。保険金請求や信用リスクの評価、詐欺の防止を目的とした機械学習モデルを開発し実運用に成功している。複数のオンラインコースで機械学習を教えており、オープンソースのPythonライブラリFeature-engineを開発・保守している。2018年にData Science Leaders Awardを受賞、2019年にデータサイエンスと分析におけるLinkedIn Voices (LinkedInインフルエンサー) の1人に認定されている。
松田晃一 : 博士(工学、東京大学)。石川県羽咋市生まれ。『宇宙船ビーグル号の冒険』を読み、絵描きではなく、コンピュータの道へ。海(海水浴)と温泉を好む。著書に『Python ライブラリの使い方~ GUI から機械学習プログラミングまで』、『p5.js プログラミングガイド改訂版』(カットシステム)、『学生のためのPython』(東京電機大学出版局)、『WebGL Programming Guide』(Addison-Welsley Professional)など、訳書に『APIデザイン・パターン』、『プログラミングのための数学』(マイナビ出版)、『生成 Deep Learning』、『詳解OpenCV3』(オライリー・ジャパン)、『デザインのためのデザイン』(ピアソン桐原)などがある。
※この商品は固定レイアウト型の電子書籍です。
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
※お使いの端末で無料サンプルをお試しいただいた上でのご購入をお願いいたします。
※本書内容はカラーで制作されているため、カラー表示可能な端末での閲覧を推奨いたします