计算机科学丛书:统计推荐系统作者: [美]Deepak K.Agarwal 出版时间:2019年版丛编项: 计算机科学丛书内容简介 《统计推荐系统》由LinkedIn公司的技术专家撰写,着眼于推荐系统的核心—统计方法,不仅讲解理论知识,而且分享了作者在LinkedIn和Yahoo!的实践经验。 《统计推荐系统》分为三部分:第一部分介绍推荐系统的组成、经典推荐方法及评估方法,并引出了探索与利用问题;第二部分围绕点击通过率(CTR)预估这一重要问题,重点介绍快速在线双线性因子模型和面向回归的隐因子模型,为热门推荐和个性化推荐提供解决方案;第三部分讨论进阶主题,涵盖分解的隐含狄利克雷分布模型、张量分解模型、层次收缩模型以及多目标优化方法。目录出版者的话译者序前言第一部分 基础知识第1章 简介1.1 面向网络应用的推荐系统概述1.1.1 算法1.1.2 优化指标1.1.3 探索与利用之间的权衡1.1.4 推荐系统的评估1.1.5 推荐和搜索:推送与拉取1.2 一个简单的评分模型:热门推荐1.3 练习第2章 经典推荐方法2.1 物品特征2.1.1 分类2.1.2 词袋模型2.1.3 主题建模2.1.4 其他物品特征2.2 用户特征2.2.1 声明的个人信息2.2.2 基于内容的画像2.2.3 其他用户特征2.3 基于特征的方法2.3.1 无监督方法2.3.2 有监督方法2.3.3 上下文信息2.4 协同过滤2.4.1 基于用户-用户相似度的方法2.4.2 基于物品-物品相似度的方法2.4.3 矩阵分解2.5 混合方法2.6 小结2.7 练习第3章 面向推荐问题的探索与利用3.1 探索与利用之间的权衡简介3.2 多臂赌博机问题3.2.1 贝叶斯方法3.2.2 极小化极大方法3.2.3 启发式赌博方案3.2.4 方法评价3.3 推荐系统中的探索与利用3.3.1 热门推荐3.3.2 个性化推荐3.3.3 数据稀疏性的挑战3.4 处理数据稀疏性的探索与利用3.4.1 降维方法3.4.2 降维中的探索与利用3.4.3 在线模型3.5 小结3.6 练习第4章 评估方法4.1 传统的离线评估方法4.1.1 数据划分方法4.1.2 准确度指标4.1.3 排序指标4.2 在线分桶测试4.2.1 设置分桶测试4.2.2 在线性能指标4.2.3 测试结果分析4.3 离线模拟4.4 离线回放4.4.1 基本回放估计4.4.2 回放的扩展4.5 小结4.6 练习第二部分 常见问题设置第5章 问题设置与系统架构5.1 问题设置5.1.1 常见的推荐模块5.1.2 应用设置5.1.3 常见的统计方法5.2 系统架构5.2.1 主要组件5.2.2 示例系统第6章 热门推荐6.1 应用案例:雅虎“今日”模块6.2 问题定义6.3 贝叶斯方案6.3.1 2×2案例:两件物品,两个间隔6.3.2 K×2案例:K件物品,两个间隔6.3.3 一般解6.4 非贝叶斯方案6.5 实验评估6.5.1 比较分析6.5.2 方案刻画6.5.3 分段分析6.5.4 桶测试结果6.6 大规模内容池6.7 小结6.8 练习第7章 基于特征回归的个性化7.1 快速在线双线性因子模型7.1.1 FOBFM概述7.1.2 FOBFM详解7.2 离线训练7.2.1 EM算法7.2.2 E步骤7.2.3 M步骤7.2.4 可扩展性7.3 在线学习7.3.1 在线高斯模型7.3.2 在线逻辑模型7.3.3 探索与利用方案7.3.4 在线模型选择7.4 雅虎数据集上的效果展示7.4.1 My Yahoo!数据集7.4.2 雅虎首页数据集7.4.3 不包含离线双线性项的FOBFM7.5 小结7.6 练习第8章 基于因子模型的个性化8.1 面向回归的隐因子模型8.1.1 从矩阵分解到RLFM8.1.2 模型详解8.1.3 RLFM的随机过程8.2 拟合算法8.2.1 适用于高斯响应的EM算法8.2.2 适用于逻辑响应的基于ARS的EM算法8.2.3 适用于逻辑响应的变分EM算法8.3 冷启动效果展示8.4 时间敏感物品的大规模推荐8.4.1 在线学习8.4.2 并行拟合算法8.5 大规模问题效果展示8.5.1 MovieLens-1M数据8.5.2 小规模雅虎首页数据8.5.3 大规模雅虎首页数据8.5.4 结果讨论8.6 小结8.7 练习第三部分 进阶主题第9章 基于隐含狄利克雷分布的分解9.1 简介9.2 模型9.2.1 模型概述9.2.2 模型详解9.3 训练和预测9.3.1 模型拟合9.3.2 预测9.4 实验9.4.1 MovieLens数据9.4.2 Yahoo! Buzz应用9.4.3 BookCrossing数据集9.5 相关工作9.6 小结第10章 上下文相关推荐10.1 张量分解模型10.1.1 建模10.1.2 模型拟合10.1.3 讨论10.2 层次收缩模型10.2.1 建模10.2.2 模型拟合10.2.3 局部增强张量模型10.3 多角度新闻文章推荐10.3.1 探索性数据分析10.3.2 实验评估10.4 相关物品推荐10.4.1 语义相关性10.4.2 响应预测10.4.3 预测响应和预测相关性的结合10.5 小结第11章 多目标优化11.1 应用设置11.2 分段方法11.2.1 问题设置11.2.2 目标优化11.3 个性化方法11.3.1 原始表示11.3.2 拉格朗日对偶11.4 近似方法11.4.1 聚类11.4.2 采样11.5 实验11.5.1 实验设置11.5.2 实验结果11.6 相关工作11.7 小结参考文献索引 上一篇: 给所有人的Python 第4版 [日]柴田淳 2019年版 下一篇: 零信任网络:在不可信网络中构建安全系统 [美]Evan Gilman 2019年版