深度学习原理与实践 作者:陈仲铭 出版时间:2018.8内容简介 本书详细介绍了目前深度学习相关的常用网络模型(ANN、CNN、RNN),以及不同网络模型的算法原理和核心思想。本书利用大量的实例代码对网络模型进行了分析,这些案例能够加深读者对网络模型的认识。此外,本书还提供完整的进阶内容和对应案例,让读者全面深入地了解深度学习的知识和技巧,达到学以致用的目的。本书适用于大数据平台系统工程师、算法工程师、数据科学家,可作为对人工智能和深度学习感兴趣的计算机相关从业人员的学习用书,也可作为计算机等相关专业的师生用书和培训学校的教材。目录第 1章 初探深度学习 11.1 什么是深度学习 21.1.1 机器学习的一般方法 41.1.2 选择深度学习的原因 51.1.3 深度学习前的思考 61.2 深度学习的应用 71.3 深度学习的硬件加速器 101.3.1 GPU比CPU更适合深度学习 101.3.2 GPU硬件选择 131.4 深度学习的软件框架 151.5 本章小结 19引用/参考 19第 2章 人工神经网络 212.1 人工神经网络概述 222.1.1 历史背景 222.1.2 基本单位—神经元 242.1.3 线性模型与激活函数 252.1.4 多层神经网络 262.2 训练与预测 282.2.1 训练 282.2.2 预测 292.3 核心算法 292.3.1 梯度下降算法 292.3.2 向前传播算法 312.3.3 反向传播算法 332.4 示例:医疗数据诊断 422.4.1 从医疗数据到数学模型 432.4.2 准备数据 442.4.3 线性分类 452.4.4 建立人工神经网络模型 462.4.5 隐层节点数对人工神经网络模型的影响 532.5 本章小结 55引用/参考 56第3章 深度学习基础及技巧 583.1 激活函数 593.1.1 线性函数 603.1.2 Sigmoid函数 613.1.3 双曲正切函数 623.1.4 ReLU函数 633.1.5 Softmax函数 643.1.6 激活函数的选择 653.2 损失函数 653.2.1 损失函数的定义 663.2.2 回归损失函数 673.2.3 分类损失函数 693.2.4 神经网络中常用的损失函数 703.3 超参数 713.3.1 学习率 713.3.2 动量 723.4 深度学习的技巧 733.4.1 数据集准备 733.4.2 数据集扩展 743.4.3 数据预处理 763.4.4 网络的初始化 813.4.5 网络过度拟合 843.4.6 正则化方法 853.4.7 GPU的使用 883.4.8 训练过程的技巧 893.5 本章小结 91引用/参考 92第4章 卷积神经网络 934.1 卷积神经网络概述 944.1.1 卷积神经网络的应用 954.1.2 卷积神经网络的结构 994.1.3 卷积神经网络与人工神经网络的联系 1014.2 卷积操作 1034.2.1 滑动窗口卷积操作 1044.2.2 网络卷积层操作 1054.2.3 矩阵快速卷积 1074.3 卷积神经网络三大核心思想 1104.3.1 传统神经网络的缺点 1104.3.2 局部感知 1114.3.3 权值共享 1124.3.4 下采样 1134.4 设计卷积神经网络架构 1154.4.1 网络层间排列规律 1164.4.2 网络参数设计规律 1164.5 示例1:可视化手写字体网络特征 1174.5.1 MNIST手写字体数据库 1184.5.2 LeNet5网络模型 1194.5.3 LeNet5网络训练 1224.5.4 可视化特征向量 1244.6 示例2:少样本卷积神经网络分类 1274.6.1 Kaggle猫狗数据库 1284.6.2 AlexNet模型 1304.6.3 AlexNet训练 1344.6.4 AlexNet预测 1364.6.5 微调网络 1374.7 本章小结 140引用/参考 141第5章 卷积神经网络视觉盛宴 1435.1 图像目标检测 1445.1.1 传统目标检测方法 1465.1.2 基于区域的网络 1475.1.3 基于回归的网络 1575.1.4 目标检测小结 1635.2 图像语义分割 1655.2.1 传统图像分割方法 1655.2.2 全卷积神经网络 1675.2.3 SegNet网络 1715.2.4 DeepLab网络 1735.3 示例1:NMS确定候选框 1765.4 示例2:SS算法提取候选框 1795.4.1 图像复杂度 1795.4.2 算法核心思想 1805.4.3 区域相似度计算 1845.5 本章小结 189引用/参考 190第6章 卷积神经网络进阶示例 1926.1 示例1:全卷积网络图像语义分割 1936.1.1 VGG连续小核卷积层 1936.1.2 VGG网络模型 1956.1.3 全卷积网络模型 1996.1.4 全卷积网络语义分割 2046.2 示例2:深度可视化网络 2096.2.1 梯度上升法 2106.2.2 可视化所有卷积层 2136.2.3 可视化输出层 2186.2.4 卷积神经网络真能理解视觉吗 2196.3 示例3:卷积神经网络艺术绘画 2206.3.1 算法思想 2216.3.2 图像风格定义 2226.3.3 图像内容定义 2246.3.4 算法实现 225引用/参考 229第7章 循环神经网络 2317.1 初识循环神经网络 2327.1.1 前馈式神经网络的缺点 2337.1.2 什么是序列数据 2347.2 循环神经网络的应用 2357.3 循环神经网络的模型结构 2377.3.1 序列数据建模 2377.3.2 基本结构 2387.3.3 其他结构 2397.4 循环神经网络的核心算法 2417.4.1 模型详解 2417.4.2 向前传播 2437.4.3 损失函数 2457.4.4 时间反向传播算法 2467.4.5 梯度消失与梯度爆炸 2517.5 示例:使用循环神经网络预测文本数据 2547.5.1 定义网络模型 2547.5.2 序列数据预处理 2557.5.3 准备输入输出数据 2587.5.4 实现简单的循环神经网络模型 2607.6 本章小结 263引用/参考 264第8章 循环神经网络进阶序列长期记忆 2658.1 长期依赖问题 2668.2 长短期记忆网络 2698.2.1 LSTM网络结构 2698.2.2 LSTM记忆单元 2708.2.3 LSTM记忆方式 2748.3 门控循环单元 2748.3.1 GRU记忆单元 2758.3.2 GRU实现 2768.3.3 GRU与LSTM比较 2778.4 示例1:神奇的机器翻译 2788.4.1 基于统计的机器翻译 2798.4.2 基于神经网络的机器翻译 2828.4.3 编码-解码模型 2838.4.4 平衡语料数据集 2878.4.5 机器翻译的未来 2928.5 示例2:智能对话机器人 2938.5.1 Seq2Seq模型 2948.5.2 Seq2Seq模型的缺点 2958.5.3 超越Seq2Seq框架 2968.6 示例3:智能语音识别音箱 2998.6.1 语音识别框架 3008.6.2 准备语音数据 3028.6.3 语音特征提取 3068.6.4 声学模型 3118.6.5 语言模型 3238.6.6 语音识别的展望 3238.7 本章小结 324引用/参考 325 上一篇: 数据驱动 通过用户数据和人工智能重塑现代营销 下一篇: 程序员求职之道 [何昊,叶向阳,薛鹏编著]