大数据架构师指南出版时间: 2016内容简介 如果你是一名IT工程师,CTO希望你在一周内提交一份公司未来IT系统基础架构的初步建议; 如果你是一位IT营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; … 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个大型IT系统的系统架构与技术架构;第三类是研讨大数据领域的具体技术,例如HADOOP相关的编程等。 对于需要快速掌握大数据系统技术脉络,或者是需要对未来IT系统做系统思考的技术工作者来说,需要的是第二类图书所提供的系统化知识。但目前业界大数据相关的书籍与资料,大多是第一类与第三类,第二类非常稀少,以至于某些希望开展大数据课程教学的高校难以找到合适的教材与参考数据。通过阅读本书,您将可以迅速建立大数据技术架构相关的知识与脉络,而不是迷失在浩如烟海的知识细节中。 本书的目的就是为了帮助读者在短的时间内,系统地把握大数据相关的技术框架,建立系统架构级别的技术思考能力与原则。本书适用于企业的IT与大数据的从业人员,IT与大数据相关的销售人员,企业的首席技术官(CTO)、首席信息官(CIO),由于本书在大数据知识具备系统性,也可以作为高校大数据方面课程的教材或辅导书。目录第一部分 大数据架构师入门第1章 大数据概述 3 1.1 什么是大数据 4 1.2 大数据的本质 6 1.3 大数据技术当前状态 8 1.4 大数据的技术发展趋势 11 第2章 大数据项目常见场景 13 2.1 实验型部署场景 14 2.2 中小型部署场景 16 2.3 大型部署场景 19 第3章 大数据方案关键因素 23 3.1 数据存储规模与数据类型 24 3.2 数据来源与数据质量 25 3.3 业务特征 26 3.4 经济可行性 27 3.5 运维管理要求 28 3.6 安全性要求 29 3.7 部署要求 31 3.8 系统边界 32 3.9 约束条件 34 3.10 要点回顾 34 第二部分 大数据架构师基础 第4章 Hadoop基础组件 39 4.1 Hadoop简介 40 4.2 Hadoop版本演进 41 4.3 Hadoop2.0生态系统简介 42 4.4 Hadoop分布式文件系统HDFS 43 4.5 Hadoop统一资源管理框架YARN 48 4.6 Hadoop分布式计算框架MapReduce 52 4.7 Hadoop分布式集群管理系统ZooKeeper 57 第5章 Hadoop其他常用组件 61 5.1 Hadoop数据仓库工具Hive 62 5.2 Hadoop分布式数据库 HBase 65 5.3 Hadoop实时流处理引擎 Storm 70 5.4 Hadoop交互式查询引擎 Impala 74 5.5 其他常用组件 78 第6章 Spark内存计算框架 83 6.1 内存计算与Spark 84 6.2 Spark的主要概念 86 6.3 Spark核心组件介绍 96 6.4 Spark与Hadoop之间的关系 100 6.5 要点回顾 104 第7章大数据中间件层 105 7.1 中间件层简介 106 7.2 中间件层产品介绍 107 7.3 中间件层的应用 121 7.4 中间件层的发展 124 7.5 要点回顾 128 第8章大数据分析 129 8.1 数据时代 131 8.2 先进分析 133 8.3 架构与平台 136 8.4 数据分析流程 140 8.5 要点回顾 143 第9章可视化技术 145 9.1 可视化技术引言 146 9.2 什么是数据可视化 147 9.3 数据可视化设计 151 9.4 数据可视化的发展趋势 160 9.5 要点回顾 161 第10章大数据安全 163 10.1 安全体系 164 10.2 大数据系统安全 168 10.3 要点回顾 180 第11章大数据管理 181 11.1 数据管理的范围和定义 182 11.2 开源软件的管理能力 183 11.3 国内主流管理 187 11.4 大数据管理展望 195 11.5 要点回顾 195 第三部分大数据架构师实践第12章大数据项目实践 199 12.1 大数据项目架构关键步骤 201 12.2 架构师实践思考 213 第13章大数据部署实践 217 13.1 中兴通讯DAP大数据平台功能和架构 218 13.2 DAP平台特点 219 13.3 某银行成功案例 220 第四部分 大数据架构师拓展第14章分布式系统与大数据的关系 229 14.1 分布式系统概述 230 14.2 分布式系统关键协议和算法概述 237 14.3 分布式系统和大数据 241 第 15 章数据库系统与大数据的关系 245 15.1 数据库系统的历史 246 15.2 各类系统求同存异 258 15.3 大数据的发展展望 259 第16章云计算与大数据的关系 261 16.1 虚拟化概述 262 16.2 OpenStack云管理架构实现 267 16.3 大数据基于云计算IAAS部署的探讨 274 后记 277 上一篇: SpringBoot揭秘:快速构建微服务体系 下一篇: 网络攻防实战研究:漏洞利用与提权