大数据和大分析作者:段云峰 编著出版时间:2015年版内容简介 《大数据和大分析》首先阐述了大数据出现的背景,解释数据资产、数据驱动等基本概念,剖析数据分析的重要性,介绍了大分析的内容和范围以及关键点等;其次,阐述了大数据建设的基本内容、有关应用领域等,涉及收集、存储、标准、技术选择等内容;辨析了大数据与数据仓库的关系,重点介绍了数据质量、安全管理等数据管控的内容;最后,给出了与大数据建设配套的营销管理分析等方面的内容和经验,分享了如何引入互联网思维、开辟新视野的理念。本书适合电信、金融、互联网等各个行业的大数据相关从业者,包括企业管理者、开发工程师、系统建设者、业务应用者和运营人员参考阅读。目录第1章 背景 //11.1 大数据的引出和影响 //31.1.1 “大数据,大商机” //31.1.2 “数据资产”的引出 //61.1.3 数据量庞大 //91.1.4 数据结构复杂 //101.1.5 数据价值有待挖掘 //111.1.6 “数据驱动”的变革 //121.1.7 互联网发展中的“数联网” //151.2 为何需要大分析 //161.2.1 数据价值评估 //161.2.2 “数据资产”变现问题 //181.2.3 大分析的技术基础 //201.2.4 大分析面临的问题 //261.3 大分析的应用案例 //291.3.1 新的“啤酒和尿布” //291.3.2 KPI信息地图 //301.3.3 “大数据、超细分、微营销” //321.4 小结 //34第2章 大数据基础 //352.1 大数据的基本理念 //362.1.1 概念和定义探索 //362.1.2 大数据的技术基础 //372.1.3 没有大分析,大数据就是大垃圾 //382.1.4 大数据如何借鉴“数据仓库”的经验 //382.1.5 企业级数据中心 //412.2 大数据与数据仓库的关系 //422.2.1 大数据扩展数据仓库理论架构 //422.2.2 大数据继承数据仓库数据管理的经验 //432.2.3 大数据开启了非结构化数据的处理 //432.2.4 大数据要借鉴数据仓库的生态圈 //432.2.5 大数据应继承数据分析技术 //442.2.6 与数据库的关系 //442.2.7 数据仓库借鉴大数据的营销模式 //442.3 大数据的基本特点 //452.3.1 “4V”特点 //452.3.2 大分析角度的大数据特征 //452.4 大数据的价值和意义 //462.4.1 围绕客户信息,提供全方位服务 //462.4.2 构筑“虚拟团队”,提升团队管理水平 //462.4.3 让“智慧城市”“智能交通”等变为可能 //472.4.4 构筑“理性社会”终于成为可能 //472.4.5 中国前所未有的一次“弯道超车”机遇 //472.5 大数据的问题和挑战 //482.5.1 数据质量问题越发突出 //482.5.2 数据分析技术尚缺实质突破 //482.5.3 大数据应用水平需要逐步演进、逐步深化 //482.5.4 大数据技术架构面临突破 //492.5.5 数据理念与国外仍然相距甚远 //492.5.6 大数据是一项系统工程 //492.6 小结 //50第3章 大数据的管理 //513.1 数据如何收集 //523.1.1 能获取哪些数据 //523.1.2 基于数据价值,决定数据的收集、存放策略 //533.1.3 没有应用时,是否收集数据 //533.2 数据的标准 //533.2.1 数据接口 //533.2.2 数据模型 //553.3 大数据的ETL过程 //573.4 大数据如何存储 //583.4.1 数据库/数据仓库 //583.4.2 分布式文件系统(HDFS) //593.4.3 混搭模式 //633.4.4 Hive /Hbase等 //633.4.5 MPP //653.5 数据如何估值和计费 //653.5.1 什么数据最好卖 //663.5.2 市场价格 //663.5.3 数据的开放 //673.6 大数据的“数据资产”管理 //673.7 数据如何保障安全 //683.8 小结 //71第4章 大数据的技术架构 //734.1 大数据处理架构 //744.1.1 大数据处理层级和域 //754.1.2 哪些计算适合并行 //784.2 为何是混搭架构 //784.2.1 大数据混搭架构的利弊分析 //794.2.2 架构是否去IOE //804.2.3 大数据混搭架构实例 //804.3 数据集市的模式 //834.3.1 数据沙盒模式 //854.3.2 贴近角色的平台及应用 //854.3.3 文件集市 //894.4 数据管控模块 //894.4.1 元数据 //894.4.2 数据质量 //914.5 大数据的“爬虫”技术 //934.5.1 定制爬虫Nutch //944.5.2 分词技术—庖丁分词 //944.5.3 索引及全文检索—Splunk //954.5.4 上网数据解析流程 //974.6 大数据安全管理框架 //994.6.1 安全管控技术架构 //994.6.2 管理制度建设 //1014.6.3 去隐私化技术举例 //1034.7 小结 //108第5章 大数据的数据质量管控 //1115.1 数据质量概念 //1135.1.1 基本概念 //1135.1.2 大数据就不考虑质量了吗 //1175.2 元数据 //1185.2.1 数据的数据 //1185.2.2 元数据的CWM标准 //1205.2.3 元数据分类 //1225.3 数据质量管控 //1235.3.1 数据质量管控目标 //1235.3.2 数据质量子系统架构 //1245.4 如何建立数据质量管理制度 //1295.4.1 数据质量分工管理流程 //1295.4.2 及时监控和告警 //1365.5 数据质量管控产品的客户体验 //1395.5.1 降低技术门槛 //1395.5.2 产品的手机App化 //1405.6 小结 //141第6章 大数据如何带来大分析 //1436.1 没有应用的数据是垃圾数据 //1456.1.1 应用的广度 //1456.1.2 应用的深度 //1456.1.3 应用的实时性/融合性 //1466.2 大分析(BA)的概念 //1476.2.1 “大分析”的发展变化 //1476.2.2 大分析的“群众路线” //1506.3 大分析(BA)的产品开发 //1516.3.1 基于数据分析,解决实际问题 //1526.3.2 BA产品和分析工具产品的区隔 //1546.3.3 自助分析 //1586.3.4 导航式分析 //1616.4 应用推广问题 //1706.4.1 市场的“冬天”就是大分析的“春天” //1706.4.2 为何需要应用推广 //1706.4.3 如何证明分析的独特价值 //1716.4.4 如何解决员工实际的问题 //1726.4.5 电信和互联网行业应用推广对比 //1726.4.6 不同的企业用不同的推广方法 //1726.5 大分析的“闭环”问题 //1736.5.1 分析和执行的闭环执行 //1736.5.2 营销流程的设计—营销管理平台 //1736.6 小结 //176第7章 大分析应用案例 //1797.1 大分析的应用阶段 //1807.2 非结构化数据的分析 //1817.2.1 客户投诉内容分析 //1817.2.2 互联网舆情监控分析 //1837.3 客户分析 //1847.3.1 客户生命周期 //1847.3.2 客户内容属性 //1977.3.3 客户行为属性 //2037.3.4 客户新业务分析 //2187.3.5 客户满意度分析 //2207.3.6 客户流失分析 //2237.4 产品分析 //2347.4.1 建设背景和目的 //2357.4.2 整体流程 //2357.4.3 建设中涉及的模型 //2357.5 内容营销分析 //2407.5.1 手机视频产品营销触发 //2407.5.2 手机视频内容分析 //2407.5.3 目标客户筛选和细分 //2407.5.4 方案设计 //2417.5.5 营销脚本设计 //2427.5.6 营销方式选择 //2437.5.7 营销方式使用效果 //2437.5.8 效益评估 //2447.6 网格化管理分析 //2457.7 社会渠道欺诈分析 //2477.7.1 概述 //2477.7.2 模型方法 //2487.7.3 模型定义 //2507.7.4 业务应用 //2557.7.5 优化方法 //256第8章 大数据中的互联网思维 //2578.1 互联网思维介绍 //2588.1.1 九大特征 //2588.1.2 大数据为何需要互联网思维 //2608.1.3 大数据如何借助互联网思维 //2608.2 BA产品定义 //2608.3 BA产品的客户体验 //2638.3.1 客户是谁 //2638.3.2 客户的体验是什么 //2648.3.3 提升客户体验的展示形式 //2668.3.4 提升客户体验的解决问题能力 //2708.4 BA产品迭代开发 //2808.4.1 如何构建共享方式 //2808.4.2 提供API接口 //2828.4.3 提供类似App Store开发环境 //2848.5 BA产品的“客户入口”把控 //2868.5.1 抓住客户的入口 //2868.5.2 让客户参与BA产品开发 //2878.5.3 BA产品的内部客户营销 //287第9章 大数据的管理架构及探索 //2899.1 BA产品生态圈的建设 //2909.1.1 生态圈组成 //2909.1.2 生态圈盈利模式 //2929.1.3 生态圈的“共赢” //2939.2 管理架构举例 //2949.2.1 互联网企业架构 //2949.2.2 运营公司的架构 //2959.2.3 架构的特点分析 //2959.3 人才的培养 //2969.3.1 知识结构要求 //2969.3.2 交际(团队)能力要求 //2979.3.3 耐压能力要求 //2979.4 团队的构建及激励 //2989.4.1 技术人员转型业务人员 //2989.4.2 业务经验的培养和积累 //2989.4.3 待遇激励 //298第10章 后记 //299 上一篇: 基于Clementine的数据挖掘 下一篇: 应用MATLAB实现神经网络