【新規登録で全巻50％還元！】Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク全巻(1巻最新刊)|株式会社ＮＴＴデータ,猿田浩輔,土橋昌|人気漫画を無料で試し読み・全巻お得に読むならAmebaマンガ

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量のデータを扱う「ビッグデータ」や「機械学習」、「IoT（Internet of Things：物のインターネット）」などの分野で応用が期待されるOSS（Open Source Software）です。 Apache SparkはUCバークレイで提唱されたRDD（Resilient Distributed Datasets）というアーキテクチャを採用しており、メモリを積極的に活用した分散並列処理を実現します。これにより、従来よりも大幅なパフォーマンスアップが期待できます。また、Hadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopのシステムの枠組を使えます。本書はApache Sparkを使うための知識を簡潔かつ実践的に紹介していきます。Apache Sparkでは「機械学習」「グラフ処理」「ストリーミング」処理等々を実現するためのライブラリが標準で利用できますが、各分野への応用も見据えたこれらの活用方法も本書で解説します。 Apache Sparkの仕組みとその利用方法を理解することにより、一歩先を行くデータ処理の新しい潮流を知ることができます。 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク

通知管理

Apache Spark入門動かして学ぶ最新並列分散処理フレームワークのレビュー

お得に作品を読む

他の作品を探す

メニュー

ジャンル

Amebaのサービス

Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

お得に作品を読む

他の作品を探す

メニュー

ジャンル

Amebaのサービス

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク