「データサイエンス」という言葉だけ聞くと、複雑な数式や高度で高価なソフトウェアパッケージが必要と考えるかもしれません。ところが近年では、「R」や本書で紹介する「Python」など、データ分析に適した様々なオープンソースのソフトウェアやプログラミング言語が公開されており、必要な知識さえあれば誰でも簡単に高度な分析を行う環境が整ってきています。
本書はIT エンジニアの読者を対象とし、データサイエンスの入門としてPython を使用してデータ集計や機械学習などのデータ分析手法を習得することを目的としています。
効率的なデータ分析を実践し、自らのサービスにフィードハックを加えたいエンジニアにとって、必読の一冊になっています。
Numpy(ナムパイ)、Pandas(パンダス)といったPython独自の便利なライブラリを短時間で習得できます。
・著者プロフィール
東京工業大学 大学院 生命理工学研究科を卒業し、バイオ・インフォマティクスを学ぶ。現在は機械学習を用いたサービスのシステム設計や様々なサービスのデータ分析に従事している。趣味は家庭菜園であり、自宅のベランダは様々な植物で占拠されている(別な意味でもサイエンティスト)。