数据科学导论作 者: 杨旭,汤海京,丁刚毅 编出版时间: 2014丛编项: 普通高等教育"十二五"规划教材内容简介 数据科学,作为一门正在蓬勃发展的新学科,关注的是如何在大数据时代背景下运用各门与数据相关的技术和理论来服务社会。《数据科学导论/普通高等教育“十二五”规划教材》系统性地讲述了与数据科学相关的各方面知识,着重培养数据工程师所需要的技能与思维。《数据科学导论/普通高等教育“十二五”规划教材》从与数据科学相关的概念出发,通过丰富翔实的案例,从各个方面展示数据科学的运用方式,让读者有一个更为直观的认识,也可以从中感受到运用数据科学处理各个领域问题的方法和流程,并且在其中穿插了数据科学研究方式下新的思维模式的讲解。《数据科学导论/普通高等教育“十二五”规划教材》还从工程概论的流程角度来讲述数据科学的工程体系架构,展望数据科学的未来发展。《数据科学导论/普通高等教育“十二五”规划教材》可作为计算机相关专业的本科生教材,也可供相关专业技术人员阅读参考。目录第1章 引论1.1 序言1.2 数据1.2.1 数据的概念1.2.2 数据的发展史1.2.3 数据、信息与知识1.3 大数据1.3.1 大数据时代的来临1.3.2 大数据的概念1.3.3 大数据的特征1.3.4 大数据对社会所产生的影响1.3.5 迎接大数据时代的挑战1.4 数据科学1.5 本书结构第2章 数据科学在商业金融领域的应用2.1 啤酒与尿布2.1.1 案例详析2.1.2 大数据挖掘技术2.1.3 购物篮分析法2.1.4 对我们的思维模式启示2.2 比价网站的成功2.2.1 Farecast案例详析2.2.2 Decide案例详析2.2.3 对我们的思维模式启示2.3 基于大数据的个性化推荐系统2.3.1 基于亚马逊云的个性化推荐系统2.3.2 潘多拉(Pandora)——基于基因的推荐系统2.4.Target的大数据营销2.4.1 案例详析2.4.2 给我们的思维模式启示2.5 社交网络数据之于对冲基金第3章 数据科学在生物医学领域的应用3.1 流行病预测3.1.1 谷歌的流感预测3.1.2 利用微博来预测流感3.1.3 给我们的思维模式启示——大数据时代的科学伦理问题3.2 大数据与智慧医疗3.2.1 临床操作3.2.2 付款/定价3.2.3 研发3.2.4 新的商业模式3.2.5 公众健康3.2.6 给我们的思维模式启示3.3 疾病监控3.3.1 大数据服务心脏病患者3.3.2 “魔毯”病人的监控3.3.3 大数据监测脑外伤病人恢复3.4 可穿戴技术、大数据与智慧医疗3.4.1 什么是可穿戴技术3.4.2 可穿戴设备简析3.4.3 可穿戴设备与智慧医疗3.4.4 给我们的思维模式启示——可穿戴设备的缺陷第4章 数据科学在智慧城市领域的应用4.1 概述4.1.1 什么是智慧城市4.1.2 产生背景4.1.3 IT企业相继介入智慧城市领域4.1.4 国际实践4.2 韩国的松岛新城4.3 美国的智慧城市建设4.3.1 哥伦布市4.3.2 其他智慧城市建设的举措4.4 英国的智慧城市建设4.5 日本的智慧城市建设4.6 北欧智慧城市——爱沙尼亚4.7 荷兰阿姆斯特丹的智慧城市计划4.8 巴西里约热内卢的智慧城市建设4.9 智慧城市建设中所应用的数据科学技术4.9.1 数据信息的收集:利用传感网络收集数据信息4.9.2 数据信息的整合:不同数据信息的整合和统一管理4.9.3 数据信息分析与应用:大容量、实时性分析技术第5章 数据科学在影视娱乐领域的应用5.1 大数据捧红《纸牌屋》5.1.1 案例详析5.1.2 大数据如何捧红《纸牌屋》5.1.3 给我们的思维模式启示5.2 谷歌预测电影票房5.2.1 案例详析5.2.2 谷歌的预测机理5.2.3 给我们的思维模式启示5.3 利用数据预测奥斯卡奖项第6章 数据科学在其他领域的应用实例6.1 大数据帮助奥巴马赢得大选6.1.1 案例详析6.1.2 给我们的思维模式启示6.2 棱镜门6.2.1 案例详析6.2.2 “棱镜”计划6.2.3 加拿大的“棱镜门”6.2.4 给我们的思维模式启示6.3 大数据帮助寻根问祖6.3.1 案例分析6.3.2 运作机理6.4 大数据与社会治安第7章 数据科学工程概论7.1 科学研究的第四范式——数据密集型研究方法7.1.1 范式和范式的演变7.1.2 科学研究的第四范式7.2 数据密集型科学研究兴起的社会环境7.2.1 数据洪流的到来7.2.2 科学界对海量数据的关注7.2.3 关联数据运动7.2.4 政府数据开放运动7.3 对数据密集型科学研究范式的分析7.3.1 科学数据和科学研究的问题7.3.2 相应的解决方案7.4 数据的收集7.4.1 客观世界(Matter)中的数据7.4.2 主观世界(Mind)中的数据7.4.3 细谈数据7.5 数据的存储7.6 数据的管理7.6.1 NoSQL数据库简介7.6.2 NoSQL数据库的特点7.6.3 开源的NoSQL数据库软件7.7 数据的处理7.7.1 Hadoop的起源7.7.2 优点7.7.3 架构7.7.4 MapReduce流程7.8 数据的可视化7.8.1 Excel7.8.2 Raphael7.8.3 Visual.ly7.8.4 Crossfiltet7.8.5 PolyMaps7.8.6 Kartograph7.8.7 Processing7.8.8 R7.8.9 Weka7.8.10 Gephi第8章 数据科学的未来展望8.1 从业前景广阔8.2 对未来数据科学发展的探讨8.2.1 提防进入数据误区8.2.2 数据不是万能的 上一篇: 大数据领导干部读本 下一篇: Hadoop YARN权威指南