Hadoop权威指南(第三版 修订版 影印版)作者:(美)怀特(Tom White) 著出版时间:2013年版内容简介 《Hadoop权威指南(第3版)(修订版)(影印版)》的内容包括:使用Hadoop分布式文件系统(HDFS)保存大数据集;使用MapReduce运行分布式计算;使用Hadoop的数据和I/O构件实现压缩、数据完整性、序列化(包括Avro)和持久化;了解常见的陷阱和高级特性,以编写实用的MapReduce程序;设计、构建和管理专用的Hadoop集群——或者在云中运行Hadoop;使用Sqoop从关系型数据库载入数据到HDFS;使用Pig查询语言进行大规模数据处理;使用Hadoop的数据仓库系统Hive分析数据集;利用HBase处理结构化和半结构化数据,以及利用ZooKeeper构建分布式系统……目录Foreword Preface 1.Meet Hadoop 2.MapReduce 3.The Hadoop Distributed Filesystem 4.Hadoop I/O 5.Developing a MapReduce Application 6.How MapReduce Works 7.MapReduce Types and Formats 8.MapReduce Features 9.Setting Up a Hadoop Cluster 10.Administering Hadoop 11.Pig 12.Hive 13.HBase 14.ZooKeeper 15.Sqoop 16.Case Studies A.Installing Apache Hadoop B.Cloudera’s Distribution Including Apache Hadoop C.Preparing the NCDC Weather Data Index 上一篇: Apache Spark源码剖析 下一篇: 数据挖掘算法原理与实现