産品特色
內容簡介
準備好釋放數據的威力瞭嗎?通過這本施工忸怩好,你將會學習到如何通過Apache Hadoop建立和維護可靠的、可擴展的分布式係統。本書是期望分析任意大小的數據集的程序員以及想建立和運行Hadoop集群的管理員的理想選擇。
在這本麵嚮Hadoop 2的新版書籍中,作者懷特增加瞭關於YARN和一些Hadoop相關項目,如Parquet、Flume、Crunch和Spark的新章節。你將會瞭解到Hadoop版本的新變化,並且研究在醫療健康係統和基因數據處理中Hadoop的應用案例。
目錄
Foreword
Preface
Part Ⅰ.HadoopFundamentals
1.Meet Hadoop
2.MapReduce
3.The Hadoop Distributed Filesystem
4.YARN
5.Hadoop I/O
Part Ⅱ.MapReduce
6.Developing a MapReduce Application
7.How MapReduce Works
8.MapReduce Types and Formats
9.MapReduce Features
Part Ⅲ.HadoopOperations
10.Setting Up a Hadoop Cluster
11.Adminstering Hadoop
Part Ⅳ.Related Projects
12.Avro
13.Parquet
14.Flume
15.Sqoop
16.Pig
17.Hive
18.Crunch
19.Spark
20.HBase
21.ZooKeeper
Part Ⅴ.Case Studies
22.Composable Data at Cerner.
23.Biological Data Science: Saving Lives with Software
24.Cascading
A.Installing Apache Hadoop
B.Cloudera's Distribution Including Apache Hadoop
C.Preparing the NCDC Weather Data
D.The Old and New Java MapReduce APIs
Index
前言/序言
Hadoop權威指南(影印版第4版 修訂版 英文版) 下載 mobi epub pdf txt 電子書 格式