需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:10943 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
摘要:深度强化学习在解决组合优化问题上有着巨大潜力,但在三维装箱问题这一组合优化问题上的应用仍然比较少,为此,文章基于现实中公司的业务数据,采用了一种组合启发式算法,解决了一个实际的三维装箱问题,研究了深度强化学习在实际业务问题中的应用。该组合启发式算法主要由两部分组成,以深度神经网络模型——指针网络来设置货物选择规则,在货物摆放朝向规则、箱体空间划分规则设置上则是采用经典拟人式启发算法。在深度神经网络模型的训练上采用了策略梯度的强化学习方法来进行。实验结果表明,相比于没有使用深度强化学习的启发式算法,组合启发式算法在效果上有约12%的提升。 □□ 关键词:三维装箱;指针网络;强化学习
目录 摘要 Abstract 1 引言 · 1 1.1选题背景综述及意义· 1 1.2国内外研究现状-· 1 1.3论文创新性 2 1.4写作思路及内容框架 2 2组合启发式装箱算法设计-· 2 2.1启发式装箱算法设计 2 2.1.1 问题分析 2 2.1.2 启发式算法设计 · 3 2.2 指针网络模型的装箱策略生成过程· 5 2.2.1 循环神经网络 · 5 2.2.2 序列到序列模型 · 5 2.2.3 注意力机制 · 6 2.2.4 指针网络模型 6 2.3指针网络模型的参数更新方法 · 7 2.3.1强化学习简介 7 2.3.2基于策略函数的学习方法- 7 3 实验 · 8 3.1 实验配置 8 3.2 实验数据 8 3.3 实验流程 · 8 3.4 实验结果分析 · 9 4总结与展望 11 参考文献 12 附录 13 致谢 |