机器学习在线:解析阿里云机器学习平台出版时间:2017丛编项: 阿里巴巴集团技术丛书内容简介 以机器学习中的典型案例为主线,条分缕析梳理阿里云的平台功能,讲解如何用阿里云的机器学习平台来实现各类应用,包括商家作弊检测、生存预测、信用风险预测、用户购买行为预测等,并完整地介绍了机器学习的基本原理与实践技巧。目录第1章 阿里云机器学习/t11.1 产品特点/t11.2 名词解释/t21.3 构建机器学习实验/t31.3.1 新建实验/t31.3.2 使用组件搭建工作流/t41.3.3 运行实验、查看结果/t51.3.4 模型部署、在线预测/t6第2章 商家作弊行为检测/t72.1 数据探索/t82.2 建模、预测和评估/t152.3 尝试其他分类模型/t192.4 判断商家作弊/t24第3章 生存预测/t273.1 数据集一/t273.1.1 特征分析/t283.1.2 生存预测/t333.2 数据集二/t363.2.1 随机森林模型/t393.2.2 朴素贝叶斯模型/t47第4章 信用风险预测/t504.1 整体流程/t534.1.1 特征哑元化/t544.1.2 特征重要性/t574.2 模型效果评估/t614.3 减少模型特征的个数/t62第5章 用户购买行为预测/t655.1 数据探索/t665.2 思路/t685.2.1 用户和品牌的各种特征/t695.2.2 二分类模型训练/t715.3 计算训练数据集/t715.3.1 原始数据划分/t725.3.2 计算特征/t745.3.3 计算标签/t895.4 二分类模型训练/t905.4.1 正负样本配比/t905.4.2 逻辑回归算法/t925.4.3 随机森林算法/t94第6章 聚类与分类/t966.1 数据可视化/t976.2 K-Means聚类/t986.2.1 聚类、评估流程/t1006.2.2 聚成两类/t1016.2.3 聚成三类/t1036.3 K最近邻算法/t1046.3.1 使用KNN算法进行分类/t1056.3.2 算法比较/t1086.4 多分类模型/t1096.4.1 使用朴素贝叶斯算法/t1096.4.2 使用逻辑回归多分类算法/t1126.4.3 使用随机森林算法/t1156.4.4 各多分类模型效果对比/t118第7章 葡萄酒品质预测/t1197.1 数据探索/t1207.2 线性回归/t1237.3 GBDT回归/t125第8章 文本分析/t1278.1 分词/t1288.2 词频统计/t1308.3 单词的区分度/t1318.4 字符串比较/t1338.5 抽取关键词、关键句/t1398.5.1 原理简介/t1398.5.2 完整流程/t1418.6 主题模型/t1468.6.1 LDA模型/t1478.6.2 新闻的主题模型/t1498.6.3 数据预处理/t1508.6.4 主题与原始分类的关系/t1538.7 单词映射为向量/t1608.7.1 相近单词/t1628.7.2 单词聚类/t1658.8 组件使用小结/t168第9章 基于用户退货描述的赔付预测/t1709.1 思路/t1719.2 训练集的特征生成/t1739.3 测试集的特征生成/t1809.4 模型训练、预测、评估/t1819.5 提高召回率/t185第10章 情感分析/t18910.1 词袋模型/t19010.1.1 训练集的特征生成/t19210.1.2 测试集的特征生成/t19610.1.3 模型训练、预测、评估/t19710.2 词向量模型/t20010.2.1 特征生成/t20110.2.2 模型训练/t206第11章 影片推荐/t21111.1 协同过滤/t21211.2 整体流程/t21311.3 预处理,过滤出好评信息/t21511.4 计算影片间的相似度/t21511.5 计算用户可能喜欢的影片/t22111.6 查看推荐效果/t224第12章 支持深度学习框架/t22712.1 TensorFlow组件简介/t22712.2 Softmax模型/t23112.3 深度神经网络/t234附录A/t237 上一篇: 爆款视频内容打造与传播 下一篇: PyQt 5快速开发与实战