机器学习基础教程作者:(英)罗杰斯,(英)吉罗拉米 著,郭茂祖,王春宇,刘扬,等 译出版时间: 2014丛编项: 计算机科学丛书内容简介 《计算机科学丛书:机器学习基础教程》介绍机器学习技术及应用的主要算法,重点讲述理解主流的机器学习算法所需的核心数学和统计知识。书中介绍的算法涵盖机器学习的主要问题:分类、聚类和投影。由于本书是机器学习基础课程的教材,所以尽量减少了数学难度,仅对一小部分重要算法给出详细的描述和推导,而对大部分算法仅给出简单介绍,目的在于使学生打好基础,增强信心和兴趣,鼓励他们进一步学习该领域的高级主题或从事相关研究工作。《计算机科学丛书:机器学习基础教程》是机器学习导论课程教材,适合作为计算机、自动化及相关专业高年级本科生或研究生的教材,也可供研究人员和工程技术人员参考。目录出版者的话译者序前言第1章 线性建模:最小二乘法1.1 线性建模1.1.1 定义模型1.1.2 模型假设1.1.3 定义什么是好的模型1.1.4 最小二乘解:一个有效的例子1.1.5 有效的例子1.1.6 奥运会数据的最小二乘拟合1.1.7 小结1.2 预测1.2.1 第二个奥运会数据集1.2.2 小结1.3 向量/矩阵符号1.3.1 例子1.3.2 数值的例子1.3.3 预测1.3.4 小结1.4 线性模型的非线性响应1.5 泛化与过拟合1.5.1 验证数据1.5.2 交叉验证1.5.3 K折交叉验证的计算缩放1.6 正则化最小二乘法1.7 练习其他阅读材料第2章 线性建模:最大似然方法2.1 误差作为噪声2.2 随机变量和概率2.2.1 随机变量2.2.2 概率和概率分布2.2.3 概率的加法2.2.4 条件概率2.2.5 联合概率2.2.6 边缘化2.2.7 贝叶斯规则介绍2.2.8 期望值2.3 常见的离散分布2.3.1 伯努利分布2.3.2 二项分布2.3.3 多项分布2.4 连续型随机变量--概率密度函数2.5 常见的连续概率密度函数2.5.1 均匀密度函数2.5.2 β密度函数2.5.3 高斯密度函数2.5.4 多元高斯2.5.5 小结2.6 产生式的考虑(续)2.7 似然估计2.7.1 数据集的似然值2.7.2 最大似然2.7.3 最大似然解的特点2.7.4 最大似然法适用于复杂模型2.8 偏差方差平衡问题2.9 噪声对参数估计的影响2.9.1 参数估计的不确定性2.9.2 与实验数据比较2.9.3 模型参数的变异性--奥运会数据2.10 预测值的变异性2.10.1 预测值的变异性--一个例子2.10.2 估计值的期望值2.10.3 小结2.11 练习其他阅读材料第3章 机器学习的贝叶斯方法3.1 硬币游戏3.1.1 计算正面朝上的次数3.1.2 贝叶斯方法3.2 精确的后验3.3 三个场景3.3.1 没有先验知识3.3.2 公平的投币3.3.3 有偏的投币3.3.4 三个场景--总结3.3.5 增加更多的数据3.4 边缘似然估计3.5 超参数3.6 图模型3.7 奥运会100米数据的贝叶斯处理实例3.7.1 模型3.7.2 似然估计3.7.3 先验概率3.7.4 后验概率3.7.5 1阶多项式3.7.6 预测3.8 边缘似然估计用于多项式模型阶的选择3.9 小结3.10 练习其他阅读材料第4章 贝叶斯推理4.1 非共轭模型4.2 二值响应4.3 点估计:最大后验估计方案4.4 拉普拉斯近似4.4.1 拉普拉斯近似实例:近似γ密度4.4.2 二值响应模型的拉普拉斯近似4.5 抽样技术4.5.1 玩飞镖游戏4.5.2 Metropolis-Hastings算法4.5.3 抽样的艺术4.6 小结4.7 练习其他阅读材料第5章 分类5.1 一般问题5.2 概率分类器5.2.1 贝叶斯分类器5.2.2 逻辑回归5.3 非概率分类器5.3.1 K近邻算法5.3.2 支持向量机和其他核方法5.3.3 小结5.4 评价分类器的性能5.4.1 准确率--0/1损失5.4.2 敏感性和特异性5.4.3 ROC曲线下的区域5.4.4 混淆矩阵5.5 判别式和产生式分类器5.6 小结5.7 练习其他阅读材料第6章 聚类分析6.1 一般问题6.2 K均值聚类6.2.1 聚类数目的选择6.2.2 K均值的不足之处6.2.3 核化K均值6.2.4 小结6.3 混合模型6.3.1 生成过程6.3.2 混合模型似然函数6.3.3 EM算法6.3.4 例子6.3.5 EM寻找局部最优6.3.6 组分数目的选择6.3.7 混合组分的其他形式6.3.8 用EM估计MAP6.3.9 贝叶斯混合模型6.4 小结6.5 练习其他阅读材料第7章 主成分分析与隐变量模型7.1 一般问题7.2 主成分分析7.2.1 选择D7.2.2 PCA的局限性7.3 隐变量模型7.3.1 隐变量模型中的混合模型7.3.2 小结7.4 变分贝叶斯7.4.1 选择Q(θ)7.4.2 优化边界7.5 PCA的概率模型7.5.1 Qτ(τ)7.5.2 Qxn(xn)7.5.3 Qwn(wm)7.5.4 期望值要求7.5.5 算法7.5.6 例子7.6 缺失值7.6.1 缺失值作为隐变量7.6.2 预测缺失值7.7 非实值数据7.7.1 概率PPCA7.7.2 议会数据可视化7.8 小结7.9 练习其他阅读材料词汇表索引 上一篇: ODPS权威指南:阿里大数据平台应用开发实践 下一篇: 数据科学实战