基于深度强化学习方法的三维装箱问题求解.docx

资料分类:精选论文 上传会员:螺蛳粉50g 更新时间:2024-01-31
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:10943
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:深度强化学习在解决组合优化问题上有着巨大潜力,但在三维装箱问题这一组合优化问题上的应用仍然比较少,为此,文章基于现实中公司的业务数据,采用了一种组合启发式算法,解决了一个实际的三维装箱问题,研究了深度强化学习在实际业务问题中的应用。该组合启发式算法主要由两部分组成,以深度神经网络模型——指针网络来设置货物选择规则,在货物摆放朝向规则、箱体空间划分规则设置上则是采用经典拟人式启发算法。在深度神经网络模型的训练上采用了策略梯度的强化学习方法来进行。实验结果表明,相比于没有使用深度强化学习的启发式算法,组合启发式算法在效果上有约12%的提升。

□□

关键词:三维装箱;指针网络;强化学习

 

目录

摘要

Abstract

1 引言 · 1

1.1选题背景综述及意义· 1

1.2国内外研究现状-· 1

1.3论文创新性 2

1.4写作思路及内容框架 2

2组合启发式装箱算法设计-· 2

2.1启发式装箱算法设计 2

2.1.1 问题分析  2

2.1.2 启发式算法设计 · 3

2.2 指针网络模型的装箱策略生成过程· 5

2.2.1 循环神经网络 · 5

2.2.2 序列到序列模型 · 5

2.2.3 注意力机制 · 6

2.2.4 指针网络模型  6

2.3指针网络模型的参数更新方法 · 7

2.3.1强化学习简介  7

2.3.2基于策略函数的学习方法- 7

3 实验 · 8

3.1 实验配置  8

3.2 实验数据  8

3.3 实验流程 · 8

3.4 实验结果分析 · 9

4总结与展望  11

参考文献 12

附录 13

致谢

相关论文资料:
最新评论
上传会员 螺蛳粉50g 对本文的描述:在经典三维装箱问题实际业务应用上,本文创新性地提出了由神经组合优化框架——指针网络模型设置货物选择规则的解决方法。同时,区别于常见网络模型参数更新方法——监督学习......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: