机器学习:实用案例解析作者:(美)康威 等著,陈开江 刘逸哲 孟晓楠 译罗森林 审校出版时间:2013内容简介 O’Reilly Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年开始,O’Reilly一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O’Reilly的发展充满了对创新的倡导、创造和发扬光大。O’Reilly为软件开发人员带来革命性的“动物书”;创建第一个商业网站(GNN);组织了影响深远的开放源代码峰会,以至于开源软件运动以此命名;创立了Make杂志,从而成为DIY革命的主要先锋;公司一如既往地通过多种形式缔结信息与人的纽带。O’Reilly的会议和峰会集聚了众多超级极客和高瞻远瞩的商业领袖,共同描绘出开创新产业的革命性思想。作为技术人士获取信息的选择,O’Reilly现在还将先锋专家的知识传递给普通的计算机用户。无论是通过书籍出版,在线服务或者面授课程,每一项O’Reilly的产品都反映了公司不可动摇的理念——信息是激发创新的力量。目录前言 1第1章 使用R语言 9R与机器学习 10第2章 数据分析 36分析与验证 36什么是数据 37推断数据的类型 40推断数据的含义 42数值摘要表 43均值、中位数、众数 44分位数 46标准差和方差 47可视化分析数据 49列相关的可视化 68第3章 分类:垃圾过滤 77非此即彼:二分类 77漫谈条件概率 81试写第一个贝叶斯垃圾分类器 82第4章 排序:智能收件箱 97次序未知时该如何排序 97按优先级给邮件排序 98实现一个智能收件箱 102第5章 回归模型:预测网页访问量 128回归模型简介 128预测网页流量 142定义相关性 152第6章 正则化:文本回归 155数据列之间的非线性关系:超越直线 155避免过拟合的方法 164文本回归 174第7章 优化:密码破译 182优化简介 182岭回归 188密码破译优化问题 193第8章 PCA:构建股票市场指数 203无监督学习 203主成分分析 204第9章 MDS:可视化地研究参议员相似性 212基于相似性聚类 212如何对美国参议员做聚类 219第10章 kNN:推荐系统 229k近邻算法 229R语言程序包安装数据 235第11章 分析社交图谱 239社交网络分析 239用黑客的方法研究Twitter的社交关系图数据 244分析Twitter社交网络 252第12章 模型比较 270SVM:支持向量机 270算法比较 280参考文献 287 上一篇: Spark高级数据分析 下一篇: 网络化测控系统可信技术及应用