大数据:互联网大规模数据挖掘与分布式处理作者:(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译出版时间:2012-9-1 【图书简介】 本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:□ 分布式文件系统以及Map-Reduce工具;□ 相似性搜索;□ 数据流处... 上一篇:大数据的冲击下一篇:Splunk的大数据报告和实施(英文版)