基于增强学习的制造系统调度作 者: 张智聪,郑力 著出版时间: 2016 内容简介 增强学习是人工智能领域一种应用越来越广泛的机器学习算法。《基于增强学习的制造系统调度》对增强学习的基本原理、主要经典算法及其在制造系统调度领域若干问题的应用进行阐述。主要内容包括:Sarsa(λ,k)增强学习算法等增强学习算法的介绍及相关理论证明;增强学习架构及面向生产调度问题的增强学习模型构建方式;流水车间调度问题、平行机调度问题、半导体测试调度问题等制造系统调度问题与自组织型排队网络调度问题的增强学习模型及解决方案;增强学习在以上调度问题应用的实验结果及相关分析等。《基于增强学习的制造系统调度》适合管理科学与工程、工业工程等专业的研究生和本科生使用,也可供从事制造系统分析与优化、智能调度等领域工作的研究人员和工程技术人员参考。目录前言第1章 绪论1.1 增强学习基本原理1.1.1 马尔可夫决策过程1.1.2 增强学习系统1.1.3 增强学习算法的分类与发展概述1.2 增强学习算法应用引例——最短路问题1.3 增强学习算法在调度领域的应用研究1.4 本书组织结构第2章 增强学习算法2.1 经典的增强学习算法2.1.1 TD/TD(λ)学习算法2.1.2 Q学习2.1.3 Sarsa算法2.1.4 R学习2.2 Sarsa(λ,k)算法2.2.1 Sarsa(λ,k)算法的基本原理2.2.2 前视与后视Sarsa(λ,k)算法2.2.3 Sarsa(λ,k)算法的性质2.3 SMDP型Sarsa(λ,k)算法2.4 多维行为的增强学习算法2.5 一种自适应步长的增强学习算法第3章 流水车间调度问题3.1 问题描述3.2 流水车间调度问题的增强学习模型3.2.1 系统状态表示3.2.2 行为3.2.3 报酬函数3.3 结合线性函数泛化器的TD(λ)算法及实验结果3.3.1 结合线性函数泛化器的TD(λ)算法3.3.2 实验结果第4章 平行机调度问题4.1 最小化加权平均流程时间的离线平行机调度4.1.1 问题描述4.1.2 增强学习模型4.1.3 实验结果4.2 最小化加权平均误工时间的离线平行机调度4.2.1 问题描述4.2.2 增强学习建模4.2.3 实验结果4.3 最小化加权平均流程时间的在线平行机调度4.3.1 问题描述4.3.2 增强学习模型4.3.3 实验结果4.4 最小化加权平均误工时间的在线平行机调度4.4.1 问题描述4.4.2 增强学习模型4.4.3 求解变速机调度问题的R学习4.4.4 实验结果第5章 半导体测试调度问题5.1 半导体测试调度问题描述5.2 关于半导体测试调度的研究5.2.1 附加资源充足的半导体测试调度5.2.2 附加资源受限的半导体测试调度5.2.3 和半导体测试调度相关的调度问题5.2.4 小结5.3 整数规划模型5.3.1 符号定义5.3.2 决策变量5.3.3 目标函数和约束5.3.4 问题性质分析5.4 半导体测试调度问题的增强学习模型5.4.1 状态变量及状态转移机制5.4.2 行为5.4.3 报酬函数5.5 结合函数泛化器的Sarsa(λ,k)算法5.5.1 径向基神经网络函数泛化器5.5.2 神经网络的构造5.5.3 函数泛化器的权重更新法则5.5.4 结合径向基神经网络函数泛化器的Sarsa(λ,k)算法5.6 演示算例5.7 参数设置与函数泛化器性能分析5.7.1 行为选择5.7.2 参数设置5.7.3 函数泛化器性能分析5.8 半导体测试调度实验结果与分析5.8.1 与工业方法及各行为策略对比5.8.2 与其他增强学习算法对比5.8.3 与能力约束调度方法对比5.9 讨论5.10 可重构制造系统调度5.10.1 具有可重构特性的调度系统机制5.10.2 增强学习模型架构第6章 排队网络控制问题6.1 多服务台排队系统控制的半马尔可夫决策模型6.1.1 问题描述6.1.2 半马尔可夫决策模型建模6.1.3 排队控制系统的性质6.1.4 数值例子6.2 自组织型排队网络控制问题6.2.1 自组织型排队网络控制问题描述6.2.2 自组织型排队网络控制问题的增强学习模型6.2.3 解决自组织型排队网络控制问题的增强学习算法第7章 结束语参考文献其他参考文献 上一篇: 创新驱动、转型升级 计算机辅助工艺优化设计全解析 王杰曾 编著 2015年版 下一篇: 基于多物理场耦合的插装型锥阀可视化研究 郑淑娟 著 2018年版