Webアプリケーション、Webサービスを開発・運用する
エンジニアは、HTML/HTTPやWebサーバなどWeb技術の
仕組みや基礎的な知識をおさえておかなければなりません。
本書では、実サービスでの大規模なWebクローラーの
開発・運用経験をもとに、クローラーを支える、HTTP、
文字コード、HTML、認証、Ajax/JSONなど、Webエンジニアが
おさえておくべきポイントやテクニックを学びます。
クローラーから見たWebサイトの仕組みとその実情に加えて、
現実に即した実践的かつ効率的なクローリングの方法論に
ついても解説します。
○実例をもとにHTTPやHTMLなどWebの仕組みを深く知ることができる
○大規模なクローラーの開発・運用ノウハウを知ることができる
○Webサイトの運営者(クロールされる側)もクローラーに関する知見を得ることができる
【対象読者】
本書はWebクローラーを題材としていますが、クローリングのために
必要なWeb技術の解説に重点を置いており、
主に次のような方々に読んでいただけるよう執筆しました。
● 正しい知識を身につけたいWeb開発者
● クローラビリティの高いWebサイトを作成したいWebサイト運営者
また、HTMLやCSSなど、Webサイトの作成に関わる最低限の知識、
およびサンプルコードを読解するためのプログラミングに関する基礎知識を
前提としています。サンプルコードはJavaで記述していますが、
Java固有のセマンティクスやプログラミングテクニックは可能な限り
避けていますので、Javaに対する深い理解は必要ありません。
※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。