您当前的位置:首页 > 深入云计算:Hadoop应用开发实战详解 > 下载地址2
深入云计算:Hadoop应用开发实战详解
- 名 称:深入云计算:Hadoop应用开发实战详解 - 下载地址2
- 类 别:计算机与网络
- 下载地址:[下载地址2]
- 提 取 码:
- 浏览次数:3
新闻评论(共有 0 条评论) |
资料介绍
深入云计算:Hadoop应用开发实战详解
作 者: 万川梅,谢正兰 编著
出版时间: 2013
丛编项: 深入云计算
内容简介
本书由浅入深,全面、系统地介绍了Hadoop这一高性能处理大量数据集的理想工具。本书内容主要包括HDFS、MapReduce、Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等与Hadoop相关的子项目,各个知识点都配有精心设计的大量经典的小案例,实战性和可操作性强。本书旨在帮助云计算初学者迅速掌握Hadoop系统,提升读者在云计算实践中的应用和开发能力。同时本书极强的系统性和大量翔实的案例对于有一定基础的中高级用户有非常好的参考价值。
目录
第1篇 Hadoop技术篇 第1章 初识Hadoop 1.1 Hadoop简介 1.1.1 Hadoop的起源 1.1.2 什么是Hadoop 1.1.3 Hadoop的核心技术是Google核心技术的开源实现 1.1.4 Hadoop的功能与优点 1.1.5 Hadoop的应用现状和发展趋势 1.2 Hadoop的体系结构 1.2.1 HDFS的体系结构 1.2.2 MapReduce的体系结构 1.3 Hadoop与分布式开发 1.4 Hadoop的数据管理 1.4.1 HDFS的数据管理 1.4.2 HBase的数据管理 1.4.3 Hive的数据管理 1.5 思考与总结 第2章 Hadoop的安装和配置 2.1 在Windows下安装与配置Hadoop 2.1.1 JDK的安装 2.1.2 Cygwin的安装 2.1.3 Hadoop的安装 2.2 在Linux下安装与配置Hadoop 2.2.1 Ubuntu的安装 2.2.2 JDK的安装 2.2.3 Hadoop的安装 2.3 Hadoop的执行实例 2.3.1 运行Hadoop 2.3.2 运行wordcount.java程序 2.4 Hadoop Eclipse简介和使用 2.4.1 Eclipse插件介绍 2.4.2 Eclipse插件开发配置 2.4.3 在Eclipse下运行WordCount程序 2.5 Hadoop的集群和优化 2.5.1 Hadoop的性能优化 2.5.2 Hadoop配置机架感知信息 2.6 思考与总结 第3章 HDFS海量存储 3.1 开源的GFS——HDFS 3.1.1 HDFS简介 3.1.2 HDFS的体系结构 3.1.3 HDFS的保障可靠性措施 3.2 HDFS的常用操作 3.2.1 HDFS下的文件操作 3.2.2 管理与更新 3.2.3 HDFS API详解 3.2.4 HDFS的读/写数据流 3.3 用HDFS存储海量的视频数据 3.3.1 场景分析 3.3.2 设计实现 3.4 思考与总结 第4章 初识MapReduce 4.1 MapReduce简介 4.1.1 MapReduce要解决什么问题 4.1.2 MapReduce的理论基础 4.1.3 MapReduce的编程模式 4.2 MapReduce的集群行为 4.3 Map/Reduce框架 4.4 样例分析:单词计数 4.4.1 WordCount实例的运行过程 4.4.2 WordCount的源码分析和程序处理过程 4.4.3 MapReduce常用类及其接口 4.5 实例:倒排索引 4.5.1 倒排索引的分析和设计 4.5.2 倒排索引完整源码 4.5.3 运行代码结果 4.6 MapReduce 在日志分析中数据去重案例 4.6.1 什么是数据去重 4.6.2 设计思路 4.6.3 程序代码 4.6.4 代码运行结果 4.7 数据排序实例 4.7.1 实例描述 4.7.2 设计思路 4.7.3 程序代码 4.8 思考与总结 第5章 分布式开源数据库HBase 5.1 HBase简介 5.1.1 HBase逻辑视图 5.1.2 HBase物理存储 5.1.3 子表Region服务器 5.1.4 Hmaster主服务器 5.1.5 元数据表 5.2 HBase的安装配置 5.2.1 HBase单机模式 5.2.2 HBase伪分布模式 5.2.3 HBase完全分布模式
作 者: 万川梅,谢正兰 编著
出版时间: 2013
丛编项: 深入云计算
内容简介
本书由浅入深,全面、系统地介绍了Hadoop这一高性能处理大量数据集的理想工具。本书内容主要包括HDFS、MapReduce、Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等与Hadoop相关的子项目,各个知识点都配有精心设计的大量经典的小案例,实战性和可操作性强。本书旨在帮助云计算初学者迅速掌握Hadoop系统,提升读者在云计算实践中的应用和开发能力。同时本书极强的系统性和大量翔实的案例对于有一定基础的中高级用户有非常好的参考价值。
目录
第1篇 Hadoop技术篇 第1章 初识Hadoop 1.1 Hadoop简介 1.1.1 Hadoop的起源 1.1.2 什么是Hadoop 1.1.3 Hadoop的核心技术是Google核心技术的开源实现 1.1.4 Hadoop的功能与优点 1.1.5 Hadoop的应用现状和发展趋势 1.2 Hadoop的体系结构 1.2.1 HDFS的体系结构 1.2.2 MapReduce的体系结构 1.3 Hadoop与分布式开发 1.4 Hadoop的数据管理 1.4.1 HDFS的数据管理 1.4.2 HBase的数据管理 1.4.3 Hive的数据管理 1.5 思考与总结 第2章 Hadoop的安装和配置 2.1 在Windows下安装与配置Hadoop 2.1.1 JDK的安装 2.1.2 Cygwin的安装 2.1.3 Hadoop的安装 2.2 在Linux下安装与配置Hadoop 2.2.1 Ubuntu的安装 2.2.2 JDK的安装 2.2.3 Hadoop的安装 2.3 Hadoop的执行实例 2.3.1 运行Hadoop 2.3.2 运行wordcount.java程序 2.4 Hadoop Eclipse简介和使用 2.4.1 Eclipse插件介绍 2.4.2 Eclipse插件开发配置 2.4.3 在Eclipse下运行WordCount程序 2.5 Hadoop的集群和优化 2.5.1 Hadoop的性能优化 2.5.2 Hadoop配置机架感知信息 2.6 思考与总结 第3章 HDFS海量存储 3.1 开源的GFS——HDFS 3.1.1 HDFS简介 3.1.2 HDFS的体系结构 3.1.3 HDFS的保障可靠性措施 3.2 HDFS的常用操作 3.2.1 HDFS下的文件操作 3.2.2 管理与更新 3.2.3 HDFS API详解 3.2.4 HDFS的读/写数据流 3.3 用HDFS存储海量的视频数据 3.3.1 场景分析 3.3.2 设计实现 3.4 思考与总结 第4章 初识MapReduce 4.1 MapReduce简介 4.1.1 MapReduce要解决什么问题 4.1.2 MapReduce的理论基础 4.1.3 MapReduce的编程模式 4.2 MapReduce的集群行为 4.3 Map/Reduce框架 4.4 样例分析:单词计数 4.4.1 WordCount实例的运行过程 4.4.2 WordCount的源码分析和程序处理过程 4.4.3 MapReduce常用类及其接口 4.5 实例:倒排索引 4.5.1 倒排索引的分析和设计 4.5.2 倒排索引完整源码 4.5.3 运行代码结果 4.6 MapReduce 在日志分析中数据去重案例 4.6.1 什么是数据去重 4.6.2 设计思路 4.6.3 程序代码 4.6.4 代码运行结果 4.7 数据排序实例 4.7.1 实例描述 4.7.2 设计思路 4.7.3 程序代码 4.8 思考与总结 第5章 分布式开源数据库HBase 5.1 HBase简介 5.1.1 HBase逻辑视图 5.1.2 HBase物理存储 5.1.3 子表Region服务器 5.1.4 Hmaster主服务器 5.1.5 元数据表 5.2 HBase的安装配置 5.2.1 HBase单机模式 5.2.2 HBase伪分布模式 5.2.3 HBase完全分布模式
下一篇: 数据挖掘的应用与实践:大数据时代的案例分析
上一篇: 数据压缩导论 第四版